정보

    • 업무명     : 확률분포 : 확률변수

    • 작성자     : 박진만

    • 작성일     : 2020-04-09

    • 설   명      :

    • 수정이력 :

     

     내용

    [개요]

    • 가설 검정 또는 수리 모델링 등으로 사용되는 확률 변수는 뭔가의 확률 분포에 따르는 것으로 가정되어 있다.

    • 대표적인 확률 분포는 정규 분포, 이항 분포와 포아송 분포 등이 있다.

     

     

    [특징]

    • 통계이론 설명

     

    [활용 자료]

    • 없음

     

    [자료 처리 방안 및 활용 분석 기법]

    • 없음

     

    [사용법]

    • 내용 참조

     

     

     상세 내용

    [확률 변수]

    • 확률 변수 (random variable)는 미리 알 수 없는 어떤 시도의 결과를 나타내는 변수를 뜻한다.

    • 예를 들면, 주사위를 굴리는 시도에서 해당 시도의 결과는 1,2,3,4,5,6 중 하나가 된다.

    • 시도 앞에서는 어떤 눈이 나오는지를 알 수 있기 때문에, 그것을 변수 X를 둔다.

    • 그리고 시도 후 얻은 결과로 다시 대체할 수 있다.

    • 예를 들어, 시도 후 6의 눈이 나온다면 X = 6으로 대체한다.

    • 다른 예로서, 식물의 건조 중량을 생각할 때, 그 건조 중량에 변수 X를 둘 수 있다.

    • 그리고 실제로 건조 중량을 측정하여 10.3g 이라는 결과가 나오게 되면, X = 10.3g으로 대체되게 되는 것이다.

    • 따라서, 확률 변수는 이산 값과 연속 값 모두가 가능하다.

    • 주사위를 굴리는 시동와 동전을 던지는 시도 등의 경우는 시도 결과가 이산값이 된다. 

    • 한편, 신장과 체중을 측정하는 시도 등의 경우는 시도 결과가 연속 값이 된다.

    • 확률 변수 X가 값을 가질 확률 함수의 형태로 되는 것을 확률 질량 함수나 확률 밀도 함수라고 한다.

    • 예를 들어, 주사위를 던질 때 각 1,2,3,4,5,6의 눈이 나올 확률은 모두 1/6이다. 

    \[P(X=1)=P(X=2)=\cdots=P(X=6)=\frac{1}{6}\]

    • 이 때, P (X) 를 확률 질량 함수라고 한다. 이와 반대로 X가 연속값인 경우 각 값을 취할 확률 함수의 형태로 되는 것을 확률 밀도 함수라고 한다.

     

    [확률 질량 함수 (probability mass function)]

    • 수열 \(\left\{p_{n}\right\}\)이 있고, \(k \geq 0\),  \(p k \geq 0\)이며, \(\Sigma_{k=0}^{\infty} p_{k}=1\) 일 때

    \[\begin{array}{l}
    p_{k}=P(X=k) \\
    k=0,1,2, \ldots
    \end{array}\]

    • 여기서 \(p_{k}(k=0,1,2, \ldots)\)를 X의 확률 질량 함수라고 한다. 

    • 또는 단순히 확률 함수 (probability function)라고도한다. 

    • 예를 들어, 함수 pk 는 X가 k의 값을 가질 때의 확률을 나타낸다.

    • 또한 확률 변수 X가 k 이하의 값을 가질 때의 확률의 합을 나타내는 함수의 수를 누적 분포 함수 (cumulative distribution function)라고한다.

    • 또는 단순히 분포 함수 (distribution function)라고도 한다.

    \[F(k)=P(X \leq k)=\sum_{i \leq k} p(i)\]

     

    [확률 밀도 함수 (probability density function)]

    • 확률 변수가 \((-\infty, \infty) \int_{-\infty}^{\infty} f(x) d x=1\) 일 때

    \[P(a<X<b)=\int_{a}^{b} f(x) d x\]

    • 여기서, f (x)를 X의 확률 밀도 함수라고 한다.

    • 또한,

    \[F(x)=P(X \leq x)=\int_{-\infty}^{x} f(t) d t\]

    • 이 경우에는 F(x)를 X의 누적 분포 함수라고 한다.

     

     

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기