정보
-
업무명 : R을 이용한 통계 분석 및 데이터 시각화 : 수학 기본 함수
-
작성자 : 박진만
-
작성일 : 2020-03-26
-
설 명 :
-
수정이력 :
내용
[개요]
-
R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계 분석 환경입니다.
-
통계 분석 기능으로 통계 검정, 선형 회귀 분석, 시계열 데이터 분석, 클러스터링 등을 지원하고 있습니다.
-
또한 최신 논문에서 발표된 같은 새로운 기술도 R로 구현되는 경우가 많습니다.
-
특히 시각화 기능으로 히스토그램, 막대 그래프, 선 그래프, 산포도, 나무 모양 그림이나 히트맵 등 기본적인 그래프가 기본으로 지원하고 있습니다.
-
또한 ggplot2 등의 패키지를 사용하여 더 높은 수준의 그림을 가시화할 수 있습니다.
[특징]
-
데이터를 이해하기 위해서 통계 분석 및 데이터 시각화가 요구되며 이 프로그램은 이러한 목적을 달성하기 위한 소프트웨어
[기능]
-
데이터형 소개
[활용 자료]
-
없음
[자료 처리 방안 및 활용 분석 기법]
-
없음
[사용법]
-
소스 코드 예시 참조
[사용 OS]
-
Windows 10
[사용 언어]
-
R v3.6.2
-
R Studio v1.2.5033
소스 코드
[수학 기본 함수]
sin cos tan exp log함수는 R 표준 함수로 구현되어있다.
또한 mean (평균) var (분산) sd (표준편차) 같은 통계에 관련한 기본 기능도 구현되어있다.
또한 사인 함수, 코사인 함수, 로그 함수 등의 함수는 R 표준 구현되어있다. 해당 함수는 그대로 호출하여 실행할 수 있다.
sin(1.2)
## [1] 0.932039
atanh(0.9)
## [1] 1.472219
log1p(1.2)
## [1] 0.7884574
signif(1013,2)
## [1] 1000
함수식 | 의미 | 입력 식 | 실행 결과 |
sin () | sin | sin (1.2) | 0.932039 |
asin () | ArcSin | asin (0.9) | 1.119770 |
cos () | cos | cos (1.2) | 0.3623578 |
acos () | ArcCos | acos (0.9) | 0.4510268 |
tan () | tan | tan (1.2) | 2.572152 |
atan () | ArcTan | atan (0.9) | 0.7328151 |
sinh () | sinh | sinh (1.2) | 1.509461 |
asinh () | ArcSinh | asinh (1.2) | 1.015973 |
cosh () | cosh | cosh (1.2) | 1.810656 |
acosh () | ArcCosh | acosh (1.2) | 0.6223625 |
tanh () | tanh | tanh (1.2) | 0.8336546 |
atanh () | ArcTanh | atanh (0.9) | 1.472219 |
log () | log e | log (1.2) | 0.1823216 |
log10 () | log 10 | log10 (1.2) | 0.07918125 |
log2 () | log 2 | log2 (1.2) | 0.2630344 |
log1p () | log e (1 + x) | log1p (1.2) | 0.7884574 |
exp () | exp | exp (1.2) | 3.320117 |
expm1 () | exp () - 1 | expm1 (1.2) | 2.320117 |
sqrt () | 루트 | sqrt (4) | 2 |
round () | 반올림 | round (2.6) | 3 |
trunc () | 정수 부분 | trunc (3.2) | 3 |
floor () | 소수 자르기 | floor (2.4) | 2 |
ceiling () | 소수 올림 | ceiling (3.2) | 4 |
signif (x, n) | x를 유효 숫자 n 자리로 표시 | signif (1013,2) | 1000 |
[통계 기본 함수]
통계학에 관련된 기본 함수 역시 구현되어있다.
x <- c(1, 234, 42, 64, 75657, 86, 43, 23, 623, 6)
max(x)
## [1] 75657
min(x)
## [1] 1
median(x)
## [1] 53.5
sd(x)
## [1] 23886.16
var(x) # 분산
## [1] 570548747
n <- length(x) # 데이터 수를 n에 대입
var(x) * (n - 1) / n # 표본 분산
## [1] 51349387209
함수식 | 입력 식 | 의미 |
max () | max (x) | 최대 값 : 데이터 x 중 가장 큰 값 |
min () | min (x) | 최소 : 데이터 x 중 가장 작은 값 |
mean () | mean (x) | 평균 : 데이터 x의 산술 평균 |
median () | median (x) | 중앙값 : 데이터 x를 오름차순으로 나열했을 때 중간 값. 데이터가 짝수이면 중심의 양쪽에있는 값의 가중 평균에 의해 구할 수있다. |
quantile () | quantile (x) | 분 정도 사항 : 데이터 x를 오름차순으로 나열했을 때 분위 점 |
range () | range (x) | 범위 : 최대 값에서 최소값의 차이 |
sd () | sd (x) | 표준 편차 : 공정한 분배의 삶의 제곱근 |
var () | var (x) | 불편 분산 : 편차 제곱의 합 (데이터 수 -1)로 나눈 값. |
[다음글]
[이전글]
참고 문헌
[논문]
- 없음
[보고서]
- 없음
[URL]
- 없음
문의사항
[기상학/프로그래밍 언어]
- sangho.lee.1990@gmail.com
[해양학/천문학/빅데이터]
- saimang0804@gmail.com
본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음
'프로그래밍 언어 > R' 카테고리의 다른 글
[R] R을 이용한 통계 분석 및 데이터 시각화 : 분기문 (0) | 2020.03.27 |
---|---|
[R] R을 이용한 통계 분석 및 데이터 시각화 : 함수 (0) | 2020.03.27 |
[R] R을 이용한 통계 분석 및 데이터 시각화 : 연산자 (0) | 2020.03.26 |
[R] R을 이용한 통계 분석 및 데이터 시각화 : 결측치 (0) | 2020.03.26 |
[R] R을 이용한 통계 분석 및 데이터 시각화 : 문자열 (0) | 2020.03.26 |
최근댓글