정보

    • 업무명     : 선형 회귀 :  로그 우도 함수의 최대 우도 (가능도) 추정

    • 작성자     : 박진만

    • 작성일     : 2020-04-19

    • 설   명      :

    • 수정이력 :

     

     내용

    [개요]

     

    [특징]

    • 통계이론 설명

     

    [활용 자료]

    • 없음

     

    [자료 처리 방안 및 활용 분석 기법]

    • 없음

     

    [사용법]

    • 내용 참조

     

     

     상세 내용

    [로그 우도 함수의 최대 가능도 추정]

    • 일반화 선형 모형으로 랜덤 변수 Y를 모델링 할 때 매개 변수가 β이고, 디자인 행렬이 X이고 링크 함수가 g 인 경우 모델은 아래의 식과 같이 쓰여질 수 있다.

    • 이 때, 일반화 선형 모델에 내장 된 매개 변수 β으 최대 가능도를 추정하는 방법을 보여준다.

     

     

    [일반화 선형 모형의 로그 가능도]

    • 랜덤 변수 Y의 밀도 함수는 다음 식과 같이 지수 분포 집합으로 표현 될 수 있다고 가정한다.

     

     

    • 여기서 밀도 함수 f (Y; θ)의 경우 그 가능도 L (θ Y) = f (Y; θ)도 유사한 식으로 나타낼 수 있으며, 이 때 로그 우도 함수는 다음과 같이 쓰여질 수 있다.

     

     

    • 이제, n 개의 랜덤 변수 y1, ..., yn이 있다면, 현재 로그 우도 함수는 다음과 같이 쓸 수 있다.

    • 이 경우 최적의 파라미터 β를 찾기 위해,이 로그 우도 함수를 최대화하는 β를 찾을 수 있다.

     

     

    • 로그 우도 함수의 2 차 미분은 음수 값을 취하므로, 로그 우도 함수의 최대 값은 1 차 미분이 0인 경우가 될 것이다.

     

     

    • 여기서 Newton-Raphson 방법은 로그 우도 함수의 1 차 미분이 0 인 β를 찾는 데 사용된다.

    • Newton-Raphson 방법을 사용하려면 1 차 미분뿐만 아니라 2 차 미분 역시 필요하다.

    • 즉 여기에서 먼저 로그 우도 함수의 1 차 및 2 차 미분을 찾아야 한다.

     

    [최대 가능도 추정량 (로그 가능도의 1 차 미분)]

    • 로그 가능도의 1 차 미분은 다음과 같이 쓸 수 있다.

     

     

    • 먼저, 좌변의 로그 우도 함수의 미분을 쉽게 계산할 수 있도록 공식 변환을 하여야 한다.

    • 연쇄미분으로 인해, \(\frac{\partial l}{\partial \beta}\) 는 아래와 같이 세 가지 부분으로 분해 될 수 있다.

     

     

    • 여기서 첫번째 항에 대해서는 로그 가능도를 θi 로 미분하면 해를 구할 수 있다.

     

     

    • 여기서 두 번째 항에 대해서는 \(\frac{A^{\prime}(\theta)}{\eta^{\prime}(\theta)}=\mu\)의 관계를 사용하여 해를 구할 수 있다.

     

     

    • 세 번째 항의 경우 링크 함수의 양변을 β로 미분 하여야 한다.

    • 여기서 디자인 행렬 X 의 i 번째 줄의 행 벡터에 대해 미분한다.

     

     

    • 결과적으로 로그 가능도를 β로 미분 한 식은 아래와 같이 쓰여질 수 있다.

    • 로그 가능도를 미분 한 cost의 결과는 cost 함수로 불린다. cost 함수는 일반적으로 기호 U로 나타내는 경우가 많다.

     

     

    [로그 가능도의 2차 미분]

    • \(\frac{\partial^{2} l}{\partial \beta \partial \beta^{T}} \int f(y ; \beta) d y=1\)

     

    • 따라서

     

     

    • 우변은 로그 가능도를 β로 미분 한 것이므로, 로그 가능도의 1차 미분에서 얻어진 결과를 대입하여 정리 할 수 있다.

     

     

    • 그리고 wi는

     

     

    • 또한 W 를 w로 이루어진 행렬로 나타내면

     

     

    • 로그 우도 함수의 첫 번째 미분은 cosgt 함수라고하며, 점수 함수의 분산은 피셔 정보라고 부른다.

    • 즉 p 개의 파라미터가 있는 경우, 각각의 p 개의 파라미터에 대한 피셔 정보량이 획득된다.

    • 이러한 피셔 정보량을 p × p 양의 명확한 대칭 행렬로 표현하는 행렬을 피셔 정보 행렬이라고 한다.

    • 피셔 정보 행렬은 I 또는 F로 쓰여진다.

     

     

    • 여기서 얻은 \(\mathbf{X}^{\top} \mathbf{W} \mathbf{X}\)는 로그 우도 함수의 2 차 미분 값이다.

    • 이제 1 차 및 2 차 미분의 예상 값을 얻었으므로 로그 가능성 함수를 최대화하는 β는 Newton-Raphson 방법 (IRLS 알고리즘)을 사용하여 얻을 수 있다.

     

    [Newton-Raphson 방법]

    • 구하고자 하는 것은 \(\frac{\partial l}{\partial \beta}=U=0\) 이다. 따라서 로그 가능도의 1 차 미분을 제 2 항에 대해서 테일러 급수 전개를 시행한다.

     

     

    • 이를 정리하면 다음과 같다.

     

     

    • Newton-Raphson 방법은 이러한 표현을 반복적으로 사용하여 최적의 β를 계산한다.

     

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기