[R] R을 이용한 통계 분석 및 데이터 시각화 : 수학 기본 함수

 정보

  • 업무명     : R을 이용한 통계 분석 및 데이터 시각화 : 수학 기본 함수

  • 작성자     : 박진만

  • 작성일     : 2020-03-26

  • 설   명      :

  • 수정이력 :

 

 내용

[개요]

  • R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계 분석 환경입니다. 

  • 통계 분석 기능으로 통계 검정, 선형 회귀 분석, 시계열 데이터 분석, 클러스터링 등을 지원하고 있습니다.

  • 또한 최신 논문에서 발표된 같은 새로운 기술도 R로 구현되는 경우가 많습니다.

  • 특히 시각화 기능으로 히스토그램, 막대 그래프, 선 그래프, 산포도, 나무 모양 그림이나 히트맵 등 기본적인 그래프가 기본으로 지원하고 있습니다.

  • 또한 ggplot2 등의 패키지를 사용하여 더 높은 수준의 그림을 가시화할 수 있습니다.

 

 

[특징]

  • 데이터를 이해하기 위해서 통계 분석 및 데이터 시각화가 요구되며 이 프로그램은 이러한 목적을 달성하기 위한 소프트웨어

     

[기능]

  • 데이터형 소개

 

[활용 자료]

  • 없음

 

[자료 처리 방안 및 활용 분석 기법]

  • 없음

 

[사용법]

  • 소스 코드 예시 참조

 

[사용 OS]

  • Windows 10

 

[사용 언어]

  • R v3.6.2

  • R Studio v1.2.5033

 

 소스 코드

[수학 기본 함수]

sin cos tan exp log함수는 R 표준 함수로 구현되어있다.

또한 mean (평균) var (분산)  sd (표준편차) 같은 통계에 관련한 기본 기능도 구현되어있다.

또한 사인 함수, 코사인 함수, 로그 함수 등의 함수는 R 표준 구현되어있다. 해당 함수는 그대로 호출하여 실행할 수 있다.

sin(1.2)
## [1] 0.932039

atanh(0.9)
## [1] 1.472219

log1p(1.2)
## [1] 0.7884574

signif(1013,2)
## [1] 1000
함수식 의미 입력 식 실행 결과
sin () sin sin (1.2) 0.932039
asin () ArcSin asin (0.9) 1.119770
cos () cos cos (1.2) 0.3623578
acos () ArcCos acos (0.9) 0.4510268
tan () tan tan (1.2) 2.572152
atan () ArcTan atan (0.9) 0.7328151
sinh () sinh sinh (1.2) 1.509461
asinh () ArcSinh asinh (1.2) 1.015973
cosh () cosh cosh (1.2) 1.810656
acosh () ArcCosh acosh (1.2) 0.6223625
tanh () tanh tanh (1.2) 0.8336546
atanh () ArcTanh atanh (0.9) 1.472219
log () log e log (1.2) 0.1823216
log10 () log 10 log10 (1.2) 0.07918125
log2 () log 2 log2 (1.2) 0.2630344
log1p () log e (1 + x) log1p (1.2) 0.7884574
exp () exp exp (1.2) 3.320117
expm1 () exp () - 1 expm1 (1.2) 2.320117
sqrt () 루트 sqrt (4) 2
round () 반올림 round (2.6) 3
trunc () 정수 부분 trunc (3.2) 3
floor () 소수 자르기 floor (2.4) 2
ceiling () 소수 올림 ceiling (3.2) 4
signif (x, n) x를 유효 숫자 n 자리로 표시 signif (1013,2) 1000

 

[통계 기본 함수]

통계학에 관련된 기본 함수 역시 구현되어있다.

x <- c(1, 234, 42, 64, 75657, 86, 43, 23, 623, 6)

max(x)
## [1] 75657

min(x)
## [1] 1

median(x)
## [1] 53.5

sd(x)
## [1] 23886.16

var(x)                 # 분산
## [1] 570548747

n <- length(x)      # 데이터 수를 n에 대입
var(x) * (n - 1) / n   # 표본 분산
## [1] 51349387209
함수식 입력 식 의미
max () max (x) 최대 값 : 데이터 x 중 가장 큰 값
min () min (x) 최소 : 데이터 x 중 가장 작은 값
mean () mean (x) 평균 : 데이터 x의 산술 평균
median () median (x) 중앙값 : 데이터 x를 오름차순으로 나열했을 때 중간 값. 데이터가 짝수이면 중심의 양쪽에있는 값의 가중 평균에 의해 구할 수있다.
quantile () quantile (x) 분 정도 사항 : 데이터 x를 오름차순으로 나열했을 때 분위 점
range () range (x) 범위 : 최대 값에서 최소값의 차이
sd () sd (x) 표준 편차 : 공정한 분배의 삶의 제곱근
var () var (x) 불편 분산 : 편차 제곱의 합 (데이터 수 -1)로 나눈 값.

 

[다음글]

 

[R] R을 이용한 통계 분석 및 데이터 시각화 : 함수

정보 업무명 : R을 이용한 통계 분석 및 데이터 시각화 : 함수 작성자 : 박진만 작성일 : 2020-03-27 설 명 : 수정이력 : 내용 [개요] R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계 분석..

shlee1990.tistory.com

 

[이전글]

 

[R] R을 이용한 통계 분석 및 데이터 시각화 : 연산자

정보 업무명 : R을 이용한 통계 분석 및 데이터 시각화 : 산술연산 작성자 : 박진만 작성일 : 2020-03-26 설 명 : 수정이력 : 내용 [개요] R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계..

shlee1990.tistory.com

 

 

 참고 문헌

[논문]

  • 없음

[보고서]

  • 없음

[URL]

  • 없음

 

 문의사항

[기상학/프로그래밍 언어]

  • sangho.lee.1990@gmail.com

[해양학/천문학/빅데이터]

  • saimang0804@gmail.com

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음