정보 업무명 : 선형 회귀 : 다중 회귀 분석 작성자 : 박진만 작성일 : 2020-04-19 설 명 : 수정이력 : 내용 [개요] [특징] 통계이론 설명 [활용 자료] 없음 [자료 처리 방안 및 활용 분석 기법] 없음 [사용법] 내용 참조 상세 내용 [다중 회귀 분석] 회귀 분석은 원인과 결과 또는 결과와 결과 간의 양적 관계를 확인하는 분석 방법 중 하나이다. 예를 들어, 옥신은 식물 줄기의 키 및 성장을 촉진하는 물질로 알려져 있다. 이 때 식물에 주어진 옥신 농도가 높을수록 줄기의 키 성장률이 높아진다. 따라서, 키의 성장률의 결과는 옥신 농도의 원인으로 설명 될 수 있다. 여기서 y가 성장 속도이고 x가 옥신 농도 인 경우, y 및 x는 다음 선형 회귀 방정식으로 표현할 수 있다. 위 회귀 방정..
정보 업무명 : 선형 회귀 : 단 회귀 분석 작성자 : 박진만 작성일 : 2020-04-19 설 명 : 수정이력 : 내용 [개요] [특징] 통계이론 설명 [활용 자료] 없음 [자료 처리 방안 및 활용 분석 기법] 없음 [사용법] 내용 참조 상세 내용 [단일 회귀 분석] 단일 회귀 분석은 하나의 요인이 하나의 결과를 준다는 단순한 인과 관계를 설명하는 데 사용되는 분석 방법이다. 예를 들면, 이산화탄소의 농도가 상승하면 평균 기온도 상승한다는 현상을 설명 할 때 회귀 분석이 사용될 수 있다. 회귀 분석은 다음과 같이 1 차 함수로 수식화 할 수 있다. 확률 변수 X와 Y는 각각 원인과 결과라고 볼 수있다. 원인 x가 변화함에 따라 결과 y도 변화한다. 확률 변수 X는 Y를 설명하는 변수이기 때문에 설명 변..
정보 업무명 : 베이지안 통계학: 사전 분포 작성자 : 박진만 작성일 : 2020-04-18 설 명 : 수정이력 : 내용 [개요] [특징] 통계이론 설명 [활용 자료] 없음 [자료 처리 방안 및 활용 분석 기법] 없음 [사용법] 내용 참조 상세 내용 [사전 분포] 베이즈 추론에서는 사전 분포를 결정하는 것으로부터 시작된다. 사전 분포는 과거의 문헌, 여분 데이터와 경험에서 대략적인 분포를 알고있는 경우, 그러한 분포를 이번 사전 분포로 사용할 수있다. 그러나 수집하고자 하는 선행 연구에서 데이터 수집 방법과 분석 목적이 이번이 실험 데이터 수집 방법 및 분석 목적과 일치하는지 여부를 확인할 필요가있다. 한편, 사전 분포에 대해 전혀 정보가 없는 경우는, 무 정보 사전 분포가 사용된다. 다만,이 무 정보 ..
정보 업무명 : 베이지안 통계학: 사후 분포 작성자 : 박진만 작성일 : 2020-04-18 설 명 : 수정이력 : 내용 [개요] [특징] 통계이론 설명 [활용 자료] 없음 [자료 처리 방안 및 활용 분석 기법] 없음 [사용법] 내용 참조 상세 내용 [사후 분포] 원인을 θ 결과를 z로 놓았을 때, 원인 θi 의 사전 확률 P (θi)를 w(θi)로, 그리고 사후 확률 P(θi | z)를 w'(θi | z)로, 또한 P (z | θi)를 z의 함수로써 f(z | θi)라고 쓰게 되는 경우, 베이즈 정리는 아래와 같은 형태로 쓸여질 수 있다. θ가 연속적이라면, 베이즈 정리는 적분을 이용하여 다음과 같이 쓸 수 있다. 이 때 w를 사전 분포 (prior distribution), w '사후 분포 (post..
정보 업무명 : 베이지안 통계학: 베이즈 정리 작성자 : 박진만 작성일 : 2020-04-18 설 명 : 수정이력 : 내용 [개요] [특징] 통계이론 설명 [활용 자료] 없음 [자료 처리 방안 및 활용 분석 기법] 없음 [사용법] 내용 참조 상세 내용 [베이즈 정리] 확률론과 통계학에서, 베이즈 정리(영어: Bayes' theorem)는 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리이다. 베이즈 확률론 해석에 따르면 베이즈 정리는 사전확률로부터 사후확률을 구할 수 있다. [확률 변수가 이산 값의 경우] 사건 F가 발생하는 조건이 주어지면 사건 E가 발생하는 조건부 확률은 아래와 같이 쓸 수 있다. 이제, 샘플 공간 (Ω)을 {E1, E2, ...}로 나누고 임의의 사건 F를 가질 때..
정보 업무명 : 기초통계 : Benjamini-Hochberg 보정 작성자 : 박진만 작성일 : 2020-04-16 설 명 : 수정이력 : 내용 [개요] [특징] 통계이론 설명 [활용 자료] 없음 [자료 처리 방안 및 활용 분석 기법] 없음 [사용법] 내용 참조 상세 내용 [Benjamini-Hochberg 보정] FDR (False Discovery Rate)은 실제 귀무 가설의 오탐율을 나타낸다. 예를 들어 FDR = 0.1에서 100 개의 귀무 가설을 검정하고 20 개의 가설을 기각했다고 가정하자. 현재 20 개의 기각 된 가설 중 20 x 0.1 = 2 미만의 가설은 실수로 기각 된 것으로 생각된다. 이 경우 전술 한 바와 같이, FDR을 제어함으로써 보정을위한 다양한 방법이 제안되어 왔다. 제안..