대학교/통계학개론 14

통계학개론 - (4) 수치 척도(왜도, 공분산, 상관계수)

- 왜도 - 좌우측에 치우친 정도를 말한다. 1. 정대칭 : 왜도는 0이다. 평균은 중앙값과 같다. 2. 오른쪽 꼬리 분포 : 왜도는 양이다. 보통 평균은 중앙값보다 크다. ​ 3. 왼쪽 꼬리분포 : 왜도는 음이다. 보통 평균은 중앙값 보다 작다. ​ + 왼쪽꼬리분포 : 최빈값 > 중앙값 > 평균 오른쪽꼬리분포 : 최빈값 < 중앙값 < 평균 - 두 변수간의 연관성 측정 1. 공분산 - 두 변수의 선형관계를 측정하는 척도이다. 양의 값은 양의 관계, 음의 값은 음의 관계를 나타낸다. + 분산과 마찬가지로 표본의 경우는 자유도를 1잃어 (n-1)로 표현된다. ​ 2. 상관계수 - 상관계수는 -1~+1 사이의 값을 갖는다. -1에 가까울수록 강한 음의 선형관계, +1에 가까울수록 강한 양의 선형관계를 나타낸다..

통계학개론 - (3) 기술통계 - 수치 척도(위치, 변동성)

- 위치척도 1. 평균 : 모든 자료값들의 평균 - 평균은 표본평균과 모집단 평균으로 구분할 수 있다. 참고로 모집단에서 n개를 뽑아 표본을 만들어 평균을 구한 것을 표본평균이라고 칭한다. 즉 샘플의 평균이다. ​ 2. 중앙값 - 극단값이 포함되어 있을 때 더욱 효과적이다. (값의 개수가 짝수인 경우 2개의 평균으로 구한다.) ​ 3. 최빈값 - 가장 빈번하게 나타나는 값이다. - 2개의 최빈값 = 이중모드, 3개 이상의 최빈값=다모드 -변동성 측정 1. 범위 - 최대값과 최소값의 차이이다. 변동성을 측정하는 가장 단순한 방법이다. EX) 615-425=190 ​ 2. 분산 - 자료의 변동성을 측정하는 도구이다. 편차제곱의 평균을 분산이라고 한다. + 추가로 표본 분산의 분모 즉 자유도는 n-1이다. 그..

통계학개론 - (2) 기술 통계

- 범주형 자료의 요약 1. 도수분포 - 각 계급별 항목의 개수를 요약해서 보여주는 것 2. 상대 도수분포 - 계급에 속한 자료항목의 총수에 대한 분수표시나 비율이다. 3. 백분율 도수분포 - 상대도수에 100을 곱하면 된다. 4. 막대그래프 - 계급 분리를 위해 막대는 서로 분리되어 있어야 한다. 5. 파이차트 - 원을 각 계급의 상대도수에 대응하는 면적 또는 부분으로 나눈다. - 양적 자료의 요약 1. 도수분포 - 많은 수의 자료는 많은 계급수를 필요로 한다. 보통 5~20개 사이 - 적정 계급 크기 = (가장 큰 자료값 - 가장 작은 자료값) / 계급의 수 2. 상대, 백분율 도수분포 - 각 계급을 상대, 백분율로 표시 3. 히스토그램 - 막대그래프와 달리 인접한 계급의 사각형끼리 구분이 없다. 4..

통계학개론 - (1) 자료와 통계학

- 통계학이란 ? - 통계 : 평균, 중앙값, 백분율, 지수 등과 같은 숫자로 표현된 사실을 나타낸다. - 통계학 : 자료를 수집, 분석, 표현, 해석하는 예술과 과학으로 볼 수 있다. - 용어 - 자료 : 표현과 해석을 위해 수집, 분석, 요약된 사실이나 수치이다. - 자료집합 : 특정 연구를 위해 수집된 모든 자료 - 요소 : 자료가 수집되는 대상 - 변수 : 요소들에 대한 특성 - 관찰값 : 특정요소에 대하여 수집된 측정치의 집합 ​ + 자료집합에서 자료값들의 총 수는 요소의 수에 변수의 수를 곱한 것이다. - 측정척도 1. 명목척도 - 요소의 속성을 구분하기 위해 라벨이나 명칭을 사용하는 자료 (숫자 코드를 써서 분류 등) 2. 서열척도 - 명목자료의 특성을 가지며 순서와 서열을 가지는 자료 (대..