대학교/통계학개론

통계학개론 - (4) 수치 척도(왜도, 공분산, 상관계수)

매 석 2023. 3. 23. 00:05
반응형

- 왜도

- 좌우측에 치우친 정도를 말한다.

1. 정대칭 : 왜도는 0이다. 평균은 중앙값과 같다.

2. 오른쪽 꼬리 분포 : 왜도는 양이다. 보통 평균은 중앙값보다 크다.

3. 왼쪽 꼬리분포 : 왜도는 음이다. 보통 평균은 중앙값 보다 작다.

+ 왼쪽꼬리분포 : 최빈값 > 중앙값 > 평균

오른쪽꼬리분포 : 최빈값 < 중앙값 < 평균

 

- 두 변수간의 연관성 측정

1. 공분산

- 두 변수의 선형관계를 측정하는 척도이다.

양의 값은 양의 관계, 음의 값은 음의 관계를 나타낸다.

+ 분산과 마찬가지로 표본의 경우는 자유도를 1잃어 (n-1)로 표현된다.

2. 상관계수

- 상관계수는 -1~+1 사이의 값을 갖는다.

-1에 가까울수록 강한 음의 선형관계,

+1에 가까울수록 강한 양의 선형관계를 나타낸다.

+ 상관계수는 선형관계를 측정하는 것이지 비선형관계까지 측정하는 것은 아니다.

두 변수가 높은 상관관계를 갖는다고 해도, 인과관계를 의미하지는 않는다.

- 상관계수는 분모와 분자를 보면 무조건 적으로

분모가 분자보다 크거나 같음을 알 수 있다.

+ 공분산이 있음에도 상관계수가 필요한 이유는

공분산의 숫자로 관계의 정도를 알 수 없기 때문이다. (상대 비교는 가능)

이를 표준화하여 관계의 정도를 알 수 있게 한 것이 상관계수이다.