정보

    • 업무명     : 기초통계 : 카이제곱 검정

    • 작성자     : 박진만

    • 작성일     : 2020-04-15

    • 설   명      :

    • 수정이력 :

     

     내용

    [개요]

     

    [특징]

    • 통계이론 설명

     

    [활용 자료]

    • 없음

     

    [자료 처리 방안 및 활용 분석 기법]

    • 없음

     

    [사용법]

    • 내용 참조

     

     

     상세 내용

    [카이 제곱 검정]

    • 카이 제곱 검정은 관측 데이터의 분포가 이론 값의 분포에 따르는지 여부를 검정하는 방법이다. 

    • 예를 들면, 주사위를 60 번 던졌을 때, 각 눈이 나올 횟수는 다음과 같이 되었을 때, 이론 값의 분포에 따를 지 여부를 검정할 수 있다.

     

    주사위 눈 1 2 3 4 5 6
    발생 횟수 12 10 9 9 13 7
    이론 값의 분포 10 10 10 10 10 10

     

    [카이 통계]

    • 카이 제곱 검정을 할 때 먼저 카이 통계 \(\chi^{2}\)를 아래와 같이 구한다.

    • 여기서 관측 데이터를 \(o_{i}\) , 이론 값 (기대 값)을 \(e_{i}\) 로 놓는다.

     

     

    • 이렇게 계산 된 \(\chi^{2}\) 가 카이 분포로부터 구해진 임계 값과 비교하여 검정 결과를 내릴 수 있다.

    • 예를 들어, 상기 주사위의 실험을 예로 들면,

     

     

    • 이 경우, 자유도가 6 - 1의 카이 통계 분포에 대한 위험 요소가 1 % 일 때의 경계 값은 15.09에서 Χ 2 <15.09이므로 귀무 가설을 보류한다. 

    • 즉, 관측 데이터의 분포와 이론 값의 분포가 동일하다. 즉,이 경우이 주사위는 왜곡이 없다고 할 수 있다.

     

    [R을 이용한 카이 제곱 검정]

    • R에서 카이 제곱 검정을 수행하는 chisq.test함수를 이용한다. 

    • 예를 들어, 상기 주사위 실험의 경우는 다음과 같다.

    o <- c(12, 10, 9, 9, 13, 7)
    e <- c(10, 10, 10, 10, 10, 10)
    
    chisq.test(o, p = e / sum(e))
    ## 
    ## 	Chi-squared test for given probabilities
    ## 
    ## data:  o 
    ## X-squared = 2.4, df = 5, p-value = 0.7915
    • p-value가 0.01보다 크므로 유의 수준1 % 에서 귀무 가설은 보류하게 된다.

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기