정보
- 업무명 : 데이터분석 전문가 (ADP) 필기 : 제5과목 데이터 시각화
- 작성자 : 이상호
- 작성일 : 2022.10.27
- 설 명 :
- 수정이력 :
내용
[시각화 인사이트 프로세스]
시각화 인사이트 프로세스의 의미
- 인사이트 : 예리한 관찰력으로 사물을 환희 꿰뚫어 봄
- 시각화와 인사이트 : 삼찰 (관찰, 성찰, 통찰)
탐색 (1단계)
- 사용 가능한 데이터 확인
- 연결 고리의 확인 (공통 요소 찾기, 공통 요소로 변환, 탐색 범위 설정)
- 관계의 탐색
- 데이터 명세화 (차원과 측정값)
- 데이터 구성 원리 (이벤트 기록으로서 접근, 객체 지향 관점에서 접근)
- 이상값 처리
- 차원과 측정값 유형에 따른 관계 파악 시각화
- 잘라보고 다르게 보기
- 내려다 보고 올려다보기
- 척도 조정
분석 (2단계)
- 분석 대상의 구체화
- 분석과 시각화 도구
- 지표 설정과 분석
- 2차 탐색
- 분석 목표에 따른 분석 기법
활용 (3단계)
- 1. 내부에서 적용
- 2. 외부에 대한 설명, 설득, 시각화 도구
- 3. 인사이트의 발전과 확장
[시각화 디자인]
시각화의 정의
- 데이터 시각화의 중요성
- 시각 이해와 시각화
- 시각화 분류와 구분
- 빅데이터 시각화 영역
시각화 프로세스
- 정보 디자인 프로세스
- 빅데이터 시각화 프로세스
- 데이터 수집
- 모든것을 읽기
- 내러티브 찾기
- 문제정의
- 계층 구조 만들기
- 와이어프레임 그리기
- 포맷 선택
- 시각 접근 방법 결정
시각화 방법
- 정보 구조화 : 수집, 분류, 배열, 관계 맺기
- 정보 시각화
- 정보 시각표현
- 정보 표현을 위한 그래픽 요소: 위치, 크기, 모양, 색, 명도, 기울기, 질감
- 정보 표현을 위한 그래픽 요소: 위치, 크기, 모양, 색, 명도, 기울기, 질감
- 시각정보 디자인 7원칙
- 시각적 비교 강화
- 인과관계
- 다중변수표시
- 조화
- 연관성과 진실성
- 시간순이 아닌 공간순
- 정량성을 제거 X
- 시각 시각화: 막대, 누적 막대, 점 그래프
- 분포 시각화 : 원, 도넛차트, 트리맵, 누적 연속 그래프
- 관계 시각화 : 산점도, 버블차트, 히스토그램
- 비교 시각화 : 히트맵, 체르노프페이스, 스타차트, 평행좌표계, 다차원척도법, 공간시각화
- 배경을 지워라
- 범례를 지워라
- 테두리를 지워라
- 색깔을 지워라
- 특수효과를 지워라
- 굵은글씨 지워라
- 라벨을 흐리게 처리
- 라벨을 직접 표시
시각화 구현
- 시각화 구현 개요
- 분석 도구를 이용한 시각화 구현 : R
- 라이브러리 기반의 시각화 구현 : D3.js
[기출 문제]
차시 | 평가문항 | 정답 | ||||
문제 | 보기1 | 보기2 | 보기3 | 보기4 | ||
1 | 시각적 이해의 위계 구도 상에서 인간의 경험이 본격적으로 개입되는 단계 | 데이터 | 정보 | 지식 | 지혜 | 3 |
2 | 시각과 인사이트 프로세스에 대한 설명 중 틀린 것 두개 | 통찰을 얻기 위해 살펴봐야할 대상은 외부와 내부(사람)의 두 가지다. | 지혜는 개인화된 지식 | 분석 단계에서는 그래프를 이용하지 않고 수치 분석 기법 사용 | 통찰의 활용에는 프리젠테이션도 포함 | 1,3 |
3 | 계층형 구조를 만들 수 없는 것 | 경위도 | YYYY-MM-DD | 행정구역 | 일반 텍스트 데이터 | 4 |
4 | 데이터를 명세화하기 위한 개념 관계가 없는것 | 데이터형 | 로그 데이터 | 클래스 | 메서드 | 2 |
5 | 공간 데이터의 처리와 직접적인 관계가 없는 것 두개 | 코로플레스 지도 | 지오코딩 | 워들 | vlook함수 | 3,4 |
6 | 시간에 따른 다차원 데이터의 변화를 직관적으로 살펴볼 수 있는 기법 |
트리맵 | 모션차트 | 산포도 | 피벗테이블 | 2 |
7 | 결과에 영향을 미치는 요인들 사이의 관계와 핵심 요인을 선별하는 통계적 분석 기법 두가지 | 요인 분석 | 상관분석 | 판별분석 | 주성분 분석 | 1,4 |
8 | 분석 및 지표에 대한 설명 중 맞는 것 | 빅데이터 분석에서는 표본데이터에 기반한 분석 모델링 | 결정 계수는 모델의 설명력을 의미 | 원본 데이터에서 여러 지표를 잘 추출하여 모델에 많이 반영할수록 설명력이 유의미하게 커진다. | 지표간의 설명력에 대한 효과는 요인분석을 통해 확인해볼 수 있다. | 2,4 |
9 | 통찰을 활용하는 방법 중 성격이 다른것 | 조기 경보 체계의 구축 | 설명력을 강화하는 변인의 추가 | 설명과 설득을 위한 스토리텔링 콘텐츠 제작 | 기존 모델에 대한 전면적인 재검토 | 3 |
10 | 인사이트의 발정과 확장 틀린것 | 범위와 관점이 잘 정해지지 않았을 때에는 보텀업 방식의 접근이 탑다운보다 낫다 | 인사이트는 결국은 사람의 문제로 귀결된다. | 지표의 단점은 지표만 보다보면 지표의 변화에 영향을 미치는 요인을 쉽게 찾을 수 없다는 것이다. | 빅데이터 환경에서는 실시간으로 복잡한 분석을 하는 것이 바람직하다 | 4 |
11 | 틀린 것 | 데이터-원자재 | 생산자와 사용자 같게 | 지식은 다른 영역의 정보가 자기 조직화해 획득할 수 있다. | 지혜는 자기 내면화한 지식 | 2 |
12 | 데이터 수집-모든것을 읽기 - 내러티브 찾기-문제정의 -계층 구조 만들기-와이어프레임 그리기 - 포맷 선택-시각 접근 방법 결정-정제와 테스트 | |||||
13 | LATCH (location, alphabet,time,category,hierarchy) | |||||
14 | 관계 시각화 구현 | 스캐터플롯 | 3 | |||
15 | 데이터를 시각화하는 이유 | 인사이트 | ||||
16 | 시각화에 쓰이는 패키지 | ggplot2 | ||||
17 | 그래프의 x축과 y축을 지정하는 함수 | aes | ||||
18 | 데이터가 분류유형이 많은 경우 | 선그래프 | 원그래프 | 히스토그램 | 점그래프 | 3 |
19 | 그래프의 내부 색상을 바꿔주는 옵션 | fill | ||||
20 | D3.js에서 scale 입력값의 범위 지정 함수 | domain() | ||||
21 | D3.js에서 축의 눈금 단위 지정 함수 | ticks() | ||||
22 | 시각화 라이브러리 아닌 것 | Gephi | jqPlot | D3.js | Flot | 1 |
23 | D3.js의 특징 | 항상 SVG 객체를 기반으로 동작 | 오페라브라우저 | 오픈소스 | CSS활용 | 1 |
24 | D3.js에서 시각화 요소의 위치 변경 속성 | transform | ||||
25 | 히트맵 활용 | 분포 시각화 |
참고 문헌
[논문]
- 없음
[보고서]
- 없음
[URL]
- 없음
문의사항
[기상학/프로그래밍 언어]
- sangho.lee.1990@gmail.com
[해양학/천문학/빅데이터]
- saimang0804@gmail.com
'자기계발 > 자격증' 카테고리의 다른 글
[자격증] 데이터분석 전문가 (ADP) 필기 : 기초, 핵심 요약, 문제풀이 (0) | 2023.02.14 |
---|---|
[자격증] 데이터분석 전문가 (ADP) 필기 : 10회, 11회 기출 문제 (0) | 2022.10.27 |
[자격증] 데이터분석 전문가 (ADP) 필기 : 제4과목 데이터 분석 (0) | 2022.10.27 |
[자격증] 데이터분석 전문가 (ADP) 필기 : 제3과목 데이터 분석 기획 (0) | 2022.10.27 |
[자격증] 데이터분석 전문가 (ADP) 필기 : 제2과목 데이터 처리 기술 이해 (1) | 2022.10.15 |
최근댓글