반응형

     정보

    • 업무명     : 데이터분석 전문가 (ADP) 필기 : 제5과목 데이터 시각화
    • 작성자     : 이상호
    • 작성일     : 2022.10.27
    • 설   명      :
    • 수정이력 :

     

     

     내용

    [시각화 인사이트 프로세스]

    시각화 인사이트 프로세스의 의미

    • 인사이트 : 예리한 관찰력으로 사물을 환희 꿰뚫어 봄
    • 시각화와 인사이트 : 삼찰 (관찰, 성찰, 통찰)

     

    탐색 (1단계)

    • 사용 가능한 데이터 확인
    • 연결 고리의 확인 (공통 요소 찾기, 공통 요소로 변환, 탐색 범위 설정)
    • 관계의 탐색
      • 데이터 명세화 (차원과 측정값)
      • 데이터 구성 원리 (이벤트 기록으로서 접근, 객체 지향 관점에서 접근)
      • 이상값 처리
      • 차원과 측정값 유형에 따른 관계 파악 시각화
      • 잘라보고 다르게 보기
      • 내려다 보고 올려다보기
      • 척도 조정

     

    분석 (2단계)

    • 분석 대상의 구체화
    • 분석과 시각화 도구
    • 지표 설정과 분석
      • 2차 탐색
      • 분석 목표에 따른 분석 기법

     

    활용 (3단계)

    • 1. 내부에서 적용
    • 2. 외부에 대한 설명, 설득, 시각화 도구
    • 3. 인사이트의 발전과 확장

     

    [시각화 디자인]

    시각화의 정의

    • 데이터 시각화의 중요성
    • 시각 이해와 시각화
    • 시각화 분류와 구분
    • 빅데이터 시각화 영역

    시각화 프로세스

    • 정보 디자인 프로세스
    • 빅데이터 시각화 프로세스
      • 데이터 수집
      • 모든것을 읽기
      • 내러티브 찾기
      • 문제정의
      • 계층 구조 만들기
      • 와이어프레임 그리기
      • 포맷 선택
      • 시각 접근 방법 결정

    시각화 방법

    • 정보 구조화 : 수집, 분류, 배열, 관계 맺기
    • 정보 시각화
    • 정보 시각표현
      • 정보 표현을 위한 그래픽 요소: 위치, 크기, 모양, 색, 명도, 기울기, 질감

    • 시각정보 디자인 7원칙
      • 시각적 비교 강화
      • 인과관계
      • 다중변수표시
      • 조화
      • 연관성과 진실성
      • 시간순이 아닌 공간순
      • 정량성을 제거 X

    • 시각 시각화: 막대, 누적 막대, 점 그래프
    • 분포 시각화 : 원, 도넛차트, 트리맵, 누적 연속 그래프
    • 관계 시각화 : 산점도, 버블차트, 히스토그램
    • 비교 시각화 : 히트맵, 체르노프페이스, 스타차트, 평행좌표계, 다차원척도법, 공간시각화
      • 배경을 지워라
      • 범례를 지워라
      • 테두리를 지워라
      • 색깔을 지워라
      • 특수효과를 지워라
      • 굵은글씨 지워라
      • 라벨을 흐리게 처리
      • 라벨을 직접 표시

     

    시각화 구현

    • 시각화 구현 개요
    • 분석 도구를 이용한 시각화 구현 : R
    • 라이브러리 기반의 시각화 구현 : D3.js

     

    [기출 문제]

    차시 평가문항 정답
    문제 보기1 보기2 보기3 보기4
    1 시각적 이해의 위계 구도 상에서 인간의 경험이 본격적으로 개입되는 단계 데이터 정보 지식 지혜 3
    2 시각과 인사이트 프로세스에 대한 설명 중 틀린 것 두개 통찰을 얻기 위해 살펴봐야할 대상은 외부와 내부(사람)의 두 가지다. 지혜는 개인화된 지식 분석 단계에서는 그래프를 이용하지 않고 수치 분석 기법 사용 통찰의 활용에는 프리젠테이션도 포함 1,3
    3 계층형 구조를 만들 수 없는 것 경위도 YYYY-MM-DD 행정구역 일반 텍스트 데이터 4
    4 데이터를 명세화하기 위한 개념 관계가 없는것 데이터형 로그 데이터 클래스 메서드 2
    5 공간 데이터의 처리와 직접적인 관계가 없는 것 두개 코로플레스 지도 지오코딩 워들 vlook함수 3,4
    6 시간에 따른 다차원 데이터의 변화를 직관적으로
    살펴볼 수 있는 기법
    트리맵 모션차트 산포도 피벗테이블 2
    7 결과에 영향을 미치는 요인들 사이의 관계와 핵심 요인을 선별하는 통계적 분석 기법 두가지 요인 분석 상관분석 판별분석 주성분 분석 1,4
    8  분석 및 지표에 대한 설명 중 맞는 것 빅데이터 분석에서는 표본데이터에 기반한 분석 모델링 결정 계수는 모델의 설명력을 의미 원본 데이터에서 여러 지표를 잘 추출하여 모델에 많이 반영할수록 설명력이 유의미하게 커진다. 지표간의 설명력에 대한 효과는 요인분석을 통해 확인해볼 수 있다. 2,4
    9 통찰을 활용하는 방법 중 성격이 다른것 조기 경보 체계의 구축 설명력을 강화하는 변인의 추가 설명과 설득을 위한 스토리텔링 콘텐츠 제작 기존 모델에 대한 전면적인 재검토 3
    10 인사이트의 발정과 확장 틀린것 범위와 관점이 잘 정해지지 않았을 때에는 보텀업 방식의 접근이 탑다운보다 낫다 인사이트는 결국은 사람의 문제로 귀결된다. 지표의 단점은 지표만 보다보면 지표의 변화에 영향을 미치는 요인을 쉽게 찾을 수 없다는 것이다. 빅데이터 환경에서는 실시간으로 복잡한 분석을 하는 것이 바람직하다 4
    11 틀린 것 데이터-원자재 생산자와 사용자 같게 지식은 다른 영역의 정보가 자기 조직화해 획득할 수 있다. 지혜는 자기 내면화한 지식 2
    12 데이터 수집-모든것을 읽기 - 내러티브 찾기-문제정의 -계층 구조 만들기-와이어프레임 그리기 - 포맷 선택-시각 접근 방법 결정-정제와 테스트
    13 LATCH (location, alphabet,time,category,hierarchy)  
    14 관계 시각화 구현     스캐터플롯   3
    15 데이터를 시각화하는 이유 인사이트        
    16 시각화에 쓰이는 패키지 ggplot2        
    17 그래프의 x축과 y축을 지정하는 함수 aes        
    18 데이터가 분류유형이 많은 경우 선그래프 원그래프 히스토그램 점그래프 3
    19 그래프의 내부 색상을 바꿔주는 옵션 fill        
    20 D3.js에서 scale 입력값의 범위 지정 함수 domain()        
    21 D3.js에서 축의 눈금 단위 지정 함수 ticks()        
    22 시각화 라이브러리 아닌 것 Gephi jqPlot D3.js Flot 1
    23 D3.js의 특징 항상 SVG 객체를 기반으로 동작 오페라브라우저 오픈소스 CSS활용 1
    24 D3.js에서 시각화 요소의 위치 변경 속성 transform        
    25 히트맵 활용 분포 시각화        

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com
    반응형
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기