수치척도 2

통계학개론 - (4) 수치 척도(왜도, 공분산, 상관계수)

- 왜도 - 좌우측에 치우친 정도를 말한다. 1. 정대칭 : 왜도는 0이다. 평균은 중앙값과 같다. 2. 오른쪽 꼬리 분포 : 왜도는 양이다. 보통 평균은 중앙값보다 크다. ​ 3. 왼쪽 꼬리분포 : 왜도는 음이다. 보통 평균은 중앙값 보다 작다. ​ + 왼쪽꼬리분포 : 최빈값 > 중앙값 > 평균 오른쪽꼬리분포 : 최빈값 < 중앙값 < 평균 - 두 변수간의 연관성 측정 1. 공분산 - 두 변수의 선형관계를 측정하는 척도이다. 양의 값은 양의 관계, 음의 값은 음의 관계를 나타낸다. + 분산과 마찬가지로 표본의 경우는 자유도를 1잃어 (n-1)로 표현된다. ​ 2. 상관계수 - 상관계수는 -1~+1 사이의 값을 갖는다. -1에 가까울수록 강한 음의 선형관계, +1에 가까울수록 강한 양의 선형관계를 나타낸다..

통계학개론 - (3) 기술통계 - 수치 척도(위치, 변동성)

- 위치척도 1. 평균 : 모든 자료값들의 평균 - 평균은 표본평균과 모집단 평균으로 구분할 수 있다. 참고로 모집단에서 n개를 뽑아 표본을 만들어 평균을 구한 것을 표본평균이라고 칭한다. 즉 샘플의 평균이다. ​ 2. 중앙값 - 극단값이 포함되어 있을 때 더욱 효과적이다. (값의 개수가 짝수인 경우 2개의 평균으로 구한다.) ​ 3. 최빈값 - 가장 빈번하게 나타나는 값이다. - 2개의 최빈값 = 이중모드, 3개 이상의 최빈값=다모드 -변동성 측정 1. 범위 - 최대값과 최소값의 차이이다. 변동성을 측정하는 가장 단순한 방법이다. EX) 615-425=190 ​ 2. 분산 - 자료의 변동성을 측정하는 도구이다. 편차제곱의 평균을 분산이라고 한다. + 추가로 표본 분산의 분모 즉 자유도는 n-1이다. 그..