정보

    • 업무명     : R을 이용한 통계 분석 및 데이터 시각화 : 수학 기본 함수

    • 작성자     : 박진만

    • 작성일     : 2020-03-26

    • 설   명      :

    • 수정이력 :

     

     내용

    [개요]

    • R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계 분석 환경입니다. 

    • 통계 분석 기능으로 통계 검정, 선형 회귀 분석, 시계열 데이터 분석, 클러스터링 등을 지원하고 있습니다.

    • 또한 최신 논문에서 발표된 같은 새로운 기술도 R로 구현되는 경우가 많습니다.

    • 특히 시각화 기능으로 히스토그램, 막대 그래프, 선 그래프, 산포도, 나무 모양 그림이나 히트맵 등 기본적인 그래프가 기본으로 지원하고 있습니다.

    • 또한 ggplot2 등의 패키지를 사용하여 더 높은 수준의 그림을 가시화할 수 있습니다.

     

     

    [특징]

    • 데이터를 이해하기 위해서 통계 분석 및 데이터 시각화가 요구되며 이 프로그램은 이러한 목적을 달성하기 위한 소프트웨어

       

    [기능]

    • 데이터형 소개

     

    [활용 자료]

    • 없음

     

    [자료 처리 방안 및 활용 분석 기법]

    • 없음

     

    [사용법]

    • 소스 코드 예시 참조

     

    [사용 OS]

    • Windows 10

     

    [사용 언어]

    • R v3.6.2

    • R Studio v1.2.5033

     

     소스 코드

    [수학 기본 함수]

    sin cos tan exp log함수는 R 표준 함수로 구현되어있다.

    또한 mean (평균) var (분산)  sd (표준편차) 같은 통계에 관련한 기본 기능도 구현되어있다.

    또한 사인 함수, 코사인 함수, 로그 함수 등의 함수는 R 표준 구현되어있다. 해당 함수는 그대로 호출하여 실행할 수 있다.

    sin(1.2)
    ## [1] 0.932039
    
    atanh(0.9)
    ## [1] 1.472219
    
    log1p(1.2)
    ## [1] 0.7884574
    
    signif(1013,2)
    ## [1] 1000
    함수식 의미 입력 식 실행 결과
    sin () sin sin (1.2) 0.932039
    asin () ArcSin asin (0.9) 1.119770
    cos () cos cos (1.2) 0.3623578
    acos () ArcCos acos (0.9) 0.4510268
    tan () tan tan (1.2) 2.572152
    atan () ArcTan atan (0.9) 0.7328151
    sinh () sinh sinh (1.2) 1.509461
    asinh () ArcSinh asinh (1.2) 1.015973
    cosh () cosh cosh (1.2) 1.810656
    acosh () ArcCosh acosh (1.2) 0.6223625
    tanh () tanh tanh (1.2) 0.8336546
    atanh () ArcTanh atanh (0.9) 1.472219
    log () log e log (1.2) 0.1823216
    log10 () log 10 log10 (1.2) 0.07918125
    log2 () log 2 log2 (1.2) 0.2630344
    log1p () log e (1 + x) log1p (1.2) 0.7884574
    exp () exp exp (1.2) 3.320117
    expm1 () exp () - 1 expm1 (1.2) 2.320117
    sqrt () 루트 sqrt (4) 2
    round () 반올림 round (2.6) 3
    trunc () 정수 부분 trunc (3.2) 3
    floor () 소수 자르기 floor (2.4) 2
    ceiling () 소수 올림 ceiling (3.2) 4
    signif (x, n) x를 유효 숫자 n 자리로 표시 signif (1013,2) 1000

     

    [통계 기본 함수]

    통계학에 관련된 기본 함수 역시 구현되어있다.

    x <- c(1, 234, 42, 64, 75657, 86, 43, 23, 623, 6)
    
    max(x)
    ## [1] 75657
    
    min(x)
    ## [1] 1
    
    median(x)
    ## [1] 53.5
    
    sd(x)
    ## [1] 23886.16
    
    var(x)                 # 분산
    ## [1] 570548747
    
    n <- length(x)      # 데이터 수를 n에 대입
    var(x) * (n - 1) / n   # 표본 분산
    ## [1] 51349387209
    함수식 입력 식 의미
    max () max (x) 최대 값 : 데이터 x 중 가장 큰 값
    min () min (x) 최소 : 데이터 x 중 가장 작은 값
    mean () mean (x) 평균 : 데이터 x의 산술 평균
    median () median (x) 중앙값 : 데이터 x를 오름차순으로 나열했을 때 중간 값. 데이터가 짝수이면 중심의 양쪽에있는 값의 가중 평균에 의해 구할 수있다.
    quantile () quantile (x) 분 정도 사항 : 데이터 x를 오름차순으로 나열했을 때 분위 점
    range () range (x) 범위 : 최대 값에서 최소값의 차이
    sd () sd (x) 표준 편차 : 공정한 분배의 삶의 제곱근
    var () var (x) 불편 분산 : 편차 제곱의 합 (데이터 수 -1)로 나눈 값.

     

    [다음글]

     

    [R] R을 이용한 통계 분석 및 데이터 시각화 : 함수

    정보 업무명 : R을 이용한 통계 분석 및 데이터 시각화 : 함수 작성자 : 박진만 작성일 : 2020-03-27 설 명 : 수정이력 : 내용 [개요] R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계 분석..

    shlee1990.tistory.com

     

    [이전글]

     

    [R] R을 이용한 통계 분석 및 데이터 시각화 : 연산자

    정보 업무명 : R을 이용한 통계 분석 및 데이터 시각화 : 산술연산 작성자 : 박진만 작성일 : 2020-03-26 설 명 : 수정이력 : 내용 [개요] R은 통계 분석 및 시각화 등의 기능을 갖춘 프로그래밍 언어 내지 통계..

    shlee1990.tistory.com

     

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    본 블로그는 파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기