IT지식/빅데이터

토이프로젝트 - (5) 선형회귀의 조건

매 석 2023. 6. 16. 21:28
반응형

- 이전 내용

 

 

토이프로젝트 - (4) 상관계수와 선형회귀

상관계수 pandas의 corr를 이용하여 두 변수간의 상관계수를 구할 수 있다. 공분산을 이용하여 상관계수를 ...

blog.naver.com

 

- 선형회귀의 조건

미국 증시와 한국 증시의 선형회귀 분석을 한 사례가 굉장히 많아서 나도 아무 생각없이

scipy로 선형회귀를 진행하였지만, 최근 이성효 교수님에게 해당 내용에 대해 질문하며

많은 사실을 배울 수 있었다.

첫 째로, 미국 시장과 한국 시장의 시간이 다르다는 점은 결국 반영되는 주가의 날짜가 다르다는 것을 의미한다.

예시로 현재 06월 16일 금요일 오후 9시 기준의 사진이다.

코스피

다우 존스

이렇게 다우 존스는 06.16의 시세가 아직 생기지 않은 모습이다.

이를 어떻게 처리하느냐에 따라서 결과가 달라질 수 있으니 유의해야 한다는 점이다.

두 번째로, 회귀 분석에는 전제 조건이 있다는 것이다.

통계학을 major로 하지 않는 사람들은 이 조건을 알지 못하거나 무시하고,

분석을 진행할 수도 있다. 즉 의미없는 결과를 얻을 수 있다는 것이다.

한국 증시와 미국 증시의 장 시간이 다르기 때문에,

미국 증시 이후 한국 증시가 영향을 받는 관계가 될 수도 있기에

선형 분석이 적절하지 않을 수도 있다는 사실을 알아야 한다.

 

 

- 결론

 

결과적으로 데이터 분석의 기법을 알고, 여러 라이브러리를 활용하여 분석하는 것도

중요하지만, 분석의 가장 기초는 통계학적 이론이라는 사실을 망각하면 안 된다는 점이다.

그렇기에 통계학 지식을 탄탄하게 base를 쌓아놓는 것이 정말 중요하다고 생각한다.

추가적으로 주가를 ai 또는 컴퓨터로 분석하여 예측하려고 하는 행위는 불가능에 가깝다고 본다.

그렇기에 컴퓨터로 하는 분석의 활용은 주가를 예측하는데 사용하는 것 보다,

risk를 줄이는 방향으로 활용하는 것이 더욱 좋다고 생각한다.

향후 방향은 여러 논문에서 어떤 분석을 활용했는지 조사하고 진행하려 한다.