[통계이론] 기초통계 : 카이제곱 검정

 정보

  • 업무명     : 기초통계 : 카이제곱 검정

  • 작성자     : 박진만

  • 작성일     : 2020-04-15

  • 설   명      :

  • 수정이력 :

 

 내용

[개요]

digital-marketing-1433427_1280 (1).jpg

 

[특징]

  • 통계이론 설명

 

[활용 자료]

  • 없음

 

[자료 처리 방안 및 활용 분석 기법]

  • 없음

 

[사용법]

  • 내용 참조

 

 

 상세 내용

[카이 제곱 검정]

  • 카이 제곱 검정은 관측 데이터의 분포가 이론 값의 분포에 따르는지 여부를 검정하는 방법이다. 

  • 예를 들면, 주사위를 60 번 던졌을 때, 각 눈이 나올 횟수는 다음과 같이 되었을 때, 이론 값의 분포에 따를 지 여부를 검정할 수 있다.

 

주사위 눈 1 2 3 4 5 6
발생 횟수 12 10 9 9 13 7
이론 값의 분포 10 10 10 10 10 10

 

[카이 통계]

  • 카이 제곱 검정을 할 때 먼저 카이 통계 \(\chi^{2}\)를 아래와 같이 구한다.

  • 여기서 관측 데이터를 \(o_{i}\) , 이론 값 (기대 값)을 \(e_{i}\) 로 놓는다.

 

etc-image-1

 

  • 이렇게 계산 된 \(\chi^{2}\) 가 카이 분포로부터 구해진 임계 값과 비교하여 검정 결과를 내릴 수 있다.

  • 예를 들어, 상기 주사위의 실험을 예로 들면,

 

etc-image-2

 

  • 이 경우, 자유도가 6 - 1의 카이 통계 분포에 대한 위험 요소가 1 % 일 때의 경계 값은 15.09에서 Χ 2 <15.09이므로 귀무 가설을 보류한다. 

  • 즉, 관측 데이터의 분포와 이론 값의 분포가 동일하다. 즉,이 경우이 주사위는 왜곡이 없다고 할 수 있다.

 

[R을 이용한 카이 제곱 검정]

  • R에서 카이 제곱 검정을 수행하는 chisq.test함수를 이용한다. 

  • 예를 들어, 상기 주사위 실험의 경우는 다음과 같다.

o <- c(12, 10, 9, 9, 13, 7)
e <- c(10, 10, 10, 10, 10, 10)

chisq.test(o, p = e / sum(e))
## 
## 	Chi-squared test for given probabilities
## 
## data:  o 
## X-squared = 2.4, df = 5, p-value = 0.7915
  • p-value가 0.01보다 크므로 유의 수준1 % 에서 귀무 가설은 보류하게 된다.

 

 참고 문헌

[논문]

  • 없음

[보고서]

  • 없음

[URL]

  • 없음

 

 문의사항

[기상학/프로그래밍 언어]

  • sangho.lee.1990@gmail.com

[해양학/천문학/빅데이터]

  • saimang0804@gmail.com

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음