해솔 | 해처럼 밝고 소나무처럼 바르게

통계 이론 · 2020. 4. 19. fullscreen 넓게보기

[통계 이론] 선형 회귀 : 로그 우도 함수의 최대 우도 (가능도) 추정

목차

정보
내용
상세 내용
참고 문헌
문의사항

정보

업무명 : 선형 회귀 : 로그 우도 함수의 최대 우도 (가능도) 추정
작성자 : 박진만
작성일 : 2020-04-19
설 명 :
수정이력 :

내용

[개요]

digital-marketing-1433427_1280 (1).jpg

[특징]

통계이론 설명

[활용 자료]

없음

[자료 처리 방안 및 활용 분석 기법]

없음

[사용법]

내용 참조

상세 내용

[로그 우도 함수의 최대 가능도 추정]

일반화 선형 모형으로 랜덤 변수 Y를 모델링 할 때 매개 변수가 β이고, 디자인 행렬이 X이고 링크 함수가 g 인 경우 모델은 아래의 식과 같이 쓰여질 수 있다.
이 때, 일반화 선형 모델에 내장 된 매개 변수 β으 최대 가능도를 추정하는 방법을 보여준다.

etc-image-1

[일반화 선형 모형의 로그 가능도]

랜덤 변수 Y의 밀도 함수는 다음 식과 같이 지수 분포 집합으로 표현 될 수 있다고 가정한다.

etc-image-2

여기서 밀도 함수 f (Y; θ)의 경우 그 가능도 L (θ Y) = f (Y; θ)도 유사한 식으로 나타낼 수 있으며, 이 때 로그 우도 함수는 다음과 같이 쓰여질 수 있다.

etc-image-3

이제, n 개의 랜덤 변수 y1, ..., yn이 있다면, 현재 로그 우도 함수는 다음과 같이 쓸 수 있다.
이 경우 최적의 파라미터 β를 찾기 위해,이 로그 우도 함수를 최대화하는 β를 찾을 수 있다.

etc-image-4

로그 우도 함수의 2 차 미분은 음수 값을 취하므로, 로그 우도 함수의 최대 값은 1 차 미분이 0인 경우가 될 것이다.

etc-image-5

여기서 Newton-Raphson 방법은 로그 우도 함수의 1 차 미분이 0 인 β를 찾는 데 사용된다.
Newton-Raphson 방법을 사용하려면 1 차 미분뿐만 아니라 2 차 미분 역시 필요하다.
즉 여기에서 먼저 로그 우도 함수의 1 차 및 2 차 미분을 찾아야 한다.

[최대 가능도 추정량 (로그 가능도의 1 차 미분)]

로그 가능도의 1 차 미분은 다음과 같이 쓸 수 있다.

etc-image-6

먼저, 좌변의 로그 우도 함수의 미분을 쉽게 계산할 수 있도록 공식 변환을 하여야 한다.
연쇄미분으로 인해, $\frac{\partial l}{\partial β}$ 는 아래와 같이 세 가지 부분으로 분해 될 수 있다.

etc-image-7

여기서 첫번째 항에 대해서는 로그 가능도를 θi 로 미분하면 해를 구할 수 있다.

etc-image-8

여기서 두 번째 항에 대해서는 $\frac{A^{'} (θ)}{η^{'} (θ)} = μ$ 의 관계를 사용하여 해를 구할 수 있다.

etc-image-9

세 번째 항의 경우 링크 함수의 양변을 β로 미분 하여야 한다.
여기서 디자인 행렬 X 의 i 번째 줄의 행 벡터에 대해 미분한다.

etc-image-10

결과적으로 로그 가능도를 β로 미분 한 식은 아래와 같이 쓰여질 수 있다.
로그 가능도를 미분 한 cost의 결과는 cost 함수로 불린다. cost 함수는 일반적으로 기호 U로 나타내는 경우가 많다.

etc-image-11

[로그 가능도의 2차 미분]

$\frac{\partial^{2} l}{\partial β \partial β^{T}} \int f (y; β) d y = 1$

etc-image-12

따라서

etc-image-13

우변은 로그 가능도를 β로 미분 한 것이므로, 로그 가능도의 1차 미분에서 얻어진 결과를 대입하여 정리 할 수 있다.

etc-image-14

그리고 wi는

etc-image-15

또한 W 를 w로 이루어진 행렬로 나타내면

etc-image-16

로그 우도 함수의 첫 번째 미분은 cosgt 함수라고하며, 점수 함수의 분산은 피셔 정보라고 부른다.
즉 p 개의 파라미터가 있는 경우, 각각의 p 개의 파라미터에 대한 피셔 정보량이 획득된다.
이러한 피셔 정보량을 p × p 양의 명확한 대칭 행렬로 표현하는 행렬을 피셔 정보 행렬이라고 한다.
피셔 정보 행렬은 I 또는 F로 쓰여진다.

etc-image-17

여기서 얻은 $X^{⊤} W X$ 는 로그 우도 함수의 2 차 미분 값이다.
이제 1 차 및 2 차 미분의 예상 값을 얻었으므로 로그 가능성 함수를 최대화하는 β는 Newton-Raphson 방법 (IRLS 알고리즘)을 사용하여 얻을 수 있다.

[Newton-Raphson 방법]

구하고자 하는 것은 $\frac{\partial l}{\partial β} = U = 0$ 이다. 따라서 로그 가능도의 1 차 미분을 제 2 항에 대해서 테일러 급수 전개를 시행한다.

etc-image-18

이를 정리하면 다음과 같다.

etc-image-19

Newton-Raphson 방법은 이러한 표현을 반복적으로 사용하여 최적의 β를 계산한다.

etc-image-20

참고 문헌

[논문]

없음

[보고서]

없음

[URL]

없음

문의사항

[기상학/프로그래밍 언어]

sangho.lee.1990@gmail.com

[해양학/천문학/빅데이터]

saimang0804@gmail.com

본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음

저작자표시 비영리 변경금지 (새창열림)

'통계 이론' 카테고리의 다른 글

[통계이론] 선형회귀 : 스코어 검정 (1)	2020.05.30
[통계 이론] 선형 회귀 : 우도비검정 (2)	2020.04.20
[통계 이론] 선형 회귀 : 오차구조 (error structure), 연결 함수 (link function), 선형 예측 (linar predictor) (0)	2020.04.19
[통계 이론] 선형 회귀 : 다중 회귀 분석 (0)	2020.04.19
[통계 이론] 선형 회귀 : 단일 회귀 분석 (0)	2020.04.19

통계 이론 관련 글

더 보기

티스토리툴바