정보

    • 업무명     :  4과목 기상통계 (가설검정과 추정)

    • 작성자     : 박진만

    • 작성일     : 2019-12-13

    • 설   명      :

    • 수정이력 :

     

     내용

    [핵심이론 01] 점추정과 구간추정

    • 표본으로부터 모집단의 특징이나 성격을 알아내고자 할 때, 이렇게 알아내고자 하는 값을 모수라고 한다. 이 모수에 대해 ‘어느 한 값으로 추정할 것인가?’ 또는 ‘어느 구간에 들어 있을 것인가?’에 따라 점추정과 구간추정으로 나뉜다.

    • 점추정

      • 정 의

        • 모수값을 추정함에 있어 표본으로부터 얻은 통계량 으로 추정하는 것을 말한다.

        • 모수에 가장 좋은 단일 추정값을 제공하는 데 그 초 점을 두고 있다.

      • 미지의 모수 \(\theta\)에 관한 정보를 얻기 위해 확률표본 \(X_{1}, X_{2}, \cdots, X_{n}\)을 선택하였다.

      • 확률표본 \(X_{1}, X_{2}, \cdots, X_{n}\)의 관찰값 \(x_{1}, x_{2}, \cdots, x_{n}\)을 이용하여 미지의 모수 \(\theta\)의 값을 추정하려 한다.

      • 모수 \(\theta\)를 추정하기 위해 사용한 \(X_{1}, X_{2}, \cdots, X_{n}\)의 함수 \(U\left(X_{1}, X_{2}, \cdots, X_{n}\right)\)를 \(\theta\)의 추정량(Estimator) 이라 정의하고, 통상적으로 \(\theta\)에 가까운 값인 \(U\left(x_{1}, x_{2}, \cdots, x_{n}\right)\)\(\theta\)의 추정값(Estimate)이라 부른다.

      • 이와 같이 미지의 모수 \(\theta\)에 관하여 어느 한 값만을 추정하므로 점추정(Point Estimation)이라 한다.

      • 예를 들어 표본평균은 모평균의, 표본비율은 모비율의 점추정량이라 할 수 있다.

    • 구간추정

      • 모집단의 모수인 모평균 \(\mu\), 모비율 \(p\), 모분산 \(\sigma^{2}\) 등에 대한 구간추정에 대하여 알아보자.

      • 모평균의 구간추정

        • 평균 \(\mu\), 분산 \(\sigma^{2}\) 인 모집단에서 확률표본 \(X_{1}, \cdots, X_{n}\)을 추출하였을 때, 모평균 \(\mu\)의 \(100(1-\alpha) \%\)신뢰구간은 다음과 같다.

          • 모집단이 정규분포이고, 모분산 \(\sigma^{2}\)이 기지일 때

            • \(\left(\bar{X}-Z_{\alpha} \frac{\sigma}{\sqrt{n}}, \bar{X}+\frac{Z_{\alpha}}{2} \frac{\sigma}{\sqrt{n}}\right)\)

          • 모집단이 정규분포이고, 모분산  \(\sigma^{2}\)이 미지일 때

            • \(\left(\bar{X}-t\left(n-1: \frac{\alpha}{2}\right) \frac{s}{\sqrt{n}}\right.\)

              \(\left.\bar{X}+t\left(n-1: \frac{\alpha}{2}\right) \frac{s}{\sqrt{n}}\right)\)

          • 표본크기 \(n\)이 큰 경우

            • \(\left(\bar{X}-Z_{\frac{\alpha}{2}} \frac{s}{\sqrt{n}}, \bar{X}+Z_{\frac{\alpha}{2}} \frac{s}{\sqrt{n}}\right)\)

          • 모수값이 존재할 수 있는 범위를 특정 확률 조건에서 나타낸 것을 말한다.

          • 이때 특정확률 조건을 신뢰도라 하며 실제 모수값이 존재할 수 있는 범위를 신뢰구간이라 한다.

          • 신뢰구간의 크기는 작을수록, 신뢰도는 높을수록 정밀한 추정이다.

      • 모비율의 구간추정 : 표본크기 \(n\)이 충분히 클 경우, 모비율 \(p\)의 \(100(1-\alpha) \%\) 신뢰구간은 다음과 같다.

        • \(\left(\hat{p}-Z_{\frac{\alpha}{2}} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}, \hat{p}+Z_{\frac{\alpha}{2}} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right)\)

      • 모분산의 구간추정 : 모집단이 정규분포를 할 때, 모분산 \(\sigma^{2}\)\(100(1-\alpha) \%\)신뢰구간

        • \(\left(\frac{(n-1) S^{2}}{\chi^{2}\left(n-1: \frac{\alpha}{2}\right)}, \frac{(n-1) S^{2}}{\chi^{2}\left(n-1: 1-\frac{\alpha}{2}\right)}\right)\)

     

    [핵심이론 02] 가설검정의 절차 및 오류

    • 통계적 가설검정 또는 검정

      • 모집단의 미지의 모수에 대한 주장, 추론 또는 예측 등을 모집단에서 추출한 표본에 근거하여 어떤 결정을 내리는 과정

      • 다음과 같은 가설을 세운다.

        • \(H_{0}: \mu=340 \quad v s \quad H_{1}: \mu \neq 340\)

        • 여기에서 \(H_{0}\)를 귀무가설(Null Hypothesis), \(H_{1}\)을 귀무가설에 대한 대립가설(Alternative Hypothesis) 이라 한다. 귀무가설 \(H_{0}\)는 대립가설과 상반되는 것으로, 모수 간에 차이가 없거나 관련성이 없는 경우 를 지칭하는 경우가 많다.

        • 귀무가설을 기각할 만한 충분한 이유가 있어야만 귀 무가설을 기각하여 대립가설을 채택하게 되므로, 귀무가설을 기각하지 않았더라도 꼭 귀무가설이 옳다 는 검정을 한 것은 아니다.

        • 귀무가설을 기각하거나 채택할 때 사용하는 통계 량을 검정통계량(Test Statistic)이라 한다. 귀무 가설 \(H_{0}\)를 기각하는 검정통계량의 영역을 기각역 (Rejection Region) 또는 위험역(Critical Region), 그렇지 않은 영역을 채택역(Acceptance Region)이 라 한다.

        • 가설검정의 결과는 \(H_{0}\)를 채택하거나 또는 기각하는 것밖에 없다. 따라서 표본에 근거하여 내린 결정에는 다음과 같은 두 가지 오류의 가능성이 있다. 즉, 귀무 가설 \(H_{0}\)가 참인데도 불구하고 \(H_{0}\)를 기각하거나, \(H_{0}\)가 거짓임에도 \(H_{0}\)를 기각하지 않는 경우이다.

      • 이상적인 가설검정법은 제1종 오류(Type Ⅰ Error)와 제2종 오류(Type Ⅱ Error)를 모두 범하지 않거나 또는 두 종류의 오류를 범할 확률을 동시에 줄이는 것이다. 그렇지만 표본크기가 일정할 때 제1종 오류의 가능성을 줄이면 제2종 오류의 가능성이 커지므로 두 오류의 가능성을 동시에 줄일 수는 없다. 따라서 제1종 오류만 관리하여 귀무가설 \(H_{0}\)가 참일 때 이를 기각하는 확률을 지정하여 지정된 확률 이하인 검정법을 찾는 방법을 사용한다. 제1종 오류를 범할 확률의 허용한계를 유의수준(Significance Level)이라 하며, 흔히 \(\alpha\)로 나타낸다. 유의수준 \(\alpha\)의 값으로 주로 0.05 또는 0.01을 사용한 다. 또한 P-값(P-value)이란 주어진 관측자료에 대 하여 귀무가설 \(H_{0}\)하에서 귀무가설을 기각하는 가장 작은 유의수준을 일컬으며 P-값이 작을수록 \(H_{0}\)에 대 한 반증이 강함을 의미한다.

      • ex) : P-값 ≤ \(\alpha\)이면, \(H_{0}\)를 기각한다.

      • 제1종 오류 : 귀무가설 \(H_{0}\)가 사실일 때 \(H_{0}\)를 기각 하는 오류

      • 제2종 오류 : 대립가설 \(H_{1}\)이 사실일 때 \(H_{0}\)를 기각 하지 못하는 오류

      • 유의수준 : 제1종 오류를 범할 확률의 최댓값

    • 가설검정의 절차

      • 귀무가설 \(H_{0}\)과 대립가설 \(H_{1}\)의 설정

      • 유의수준의 결정

      • \(H_{0}\)의 채택역과 위험역(기각역, Critical Region)의 결정

      • 검정통계량의 계산

      • 검정통계량과 위험역의 비교 및 결론

    • 가설검정의 오류

      • 가설검정을 시행할 때는 두 가지 경우의 오류를 범할 수 있다.

        • 제1종 오류(Type Ⅰ Error) : 올바른 가설을 기각시키는 경우

        • 제2종 오류(Type Ⅱ Error) : 그릇된 가설을 채택하는 경우

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

    문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기