정보
- 업무명 : 데이터분석 전문가 (ADP) 필기 : 제3과목 데이터 분석 기획
- 작성자 : 이상호
- 작성일 : 2022.10.27
- 설 명 :
- 수정이력 :
내용
[데이터 분석 기획의 이해]
1. 분석 기획 방향성 도출
- 분석 기획의 특징
- 분석 기획 : 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출 할 수 있도록 이를 적절하게 관리 할 수 있는 방안을 사전에 계획하는 작업
- 분석기획을 하기 위해서는 컴퓨터 사이언스, 수학 및 통계학 지식, 비즈니스 분석 능력에 대한 고른 역량과 시각이 필요
2. 분석 주제 유형 (4가지 유형을 융합적으로 반복)
- 최적화 (Optimization) : 분석 대상 및 분석 방법을 이해하고 현 문제를 최적화의 형태로 수행
- 솔루션 (Solution) : 분석 과제는 수행되고, 분석 방법을 알지 못하는 경우 솔루션을 찾는 방식으로 분석과제 수행
- 통찰 (Insight) : 분석 대상이 불분명하고, 분석 방법을 알고 있는 경우 인사이트 도출
- 발견 (Discovery) : 분석 대상, 방법을 모른다면 발견을 통하여 분석 대상 자체를 새롭게 도출
분석대상 분석방법 |
Known | Un-Known |
Known | 최적화(Optimization) | 통찰(Insight) |
Un-Known | 솔루션(Solution) | 발견(Discovery) |
3. 목표 시점별 분석 기획 방안
- 과제 중심적인 접근 방식 : 당면한 과제를 빠르게 해결
- 장기적인 마스터 플랜 방식 : 지속적인 분석 내재화
- 서로 간의 융합적으로 적용하는 것이 바람직함
- cf) Quick-win (즉각적인 실행을 통한 성과 도출)
- 프로세스 진행과정에서 일반적인 상식과 경험으로 원인이 명백한 경우 불합리한 요소를 개선 단계까지 미루지 않고, 즉시 개선함으로써 과제를 단기로 달성하고 추진하는 과정
당면한 분석 주제의 해결 (과제 단위) |
지속적 분석 문화 내재화 (마스터 플랜 단위) |
|
Speed & Test | <1차 목표> | Accuracy & Deploy |
Quick-Win | <과제의 유형> | Long Term View |
Problem Solving | <접근 방식> | Problem Definition |
4. 분석 기획 시 고려 사항
- 가용한 데이터
- 분석을 위한 데이터 확보가 필수적이다.
- 데이터 유형에 따라 적용가능한 솔루션 및 분석 방법이 다르기 때문에 데이터 유형에 대한 분석이 선행적으로 이루어져야 한다.
- 적절한 유스케이스 (Proper Use-Case) 탐색
- 유사 분석 시나리오 및 솔루션이 있다면 이를 최대한 활용하는 것이 중요하다.
- 장애 요소들에 대한 사전 계획 수립이 필요 (Low Barrier of Execution)
- 정확도를 올리기 위한 비용 사전 고려
- 조직의 역량 내재화를 위한 충분하고 계속적인 교육 및 활용 방안 등의 변화관리 (Change Management)가 고려되어야 한다.
[분석 방법론]
1. KDD (Knowledge Discovery in Database) 분석 방법론
- 1996년 Fayyad가 체계적으로 정리한 데이터 마이닝 프로세스
- 데이터 마이닝, 기계학습, 인공지능, 패턴인식, 데이터 시각화 등에서 응용될 수 있는 구조를 가짐
- 분석 절차
- 분석 대상의 비즈니스 도메인에 대한 이해와 프로젝트 목표를 정확하게 설정
- 데이터셋 선택 (Selection)
- 데이터 전처리 (Preprocessing) : 잡음 (Noise), 이상값 (Outlier), 결측치 (Missing value) 제거
- 데이터 변환 (Transformation) : 변수 선택, 차원 축소 등
- 데이터 마이닝 (Data Mining) : 분석 목적에 맞는 데이터 마이닝 기법 알고리즘 선택, 데이터 패턴 찾기, 데이터 분류, 예측 작업 시행
- 데이터 마이닝 결과 평가 (Interpretation/Evaluation) : 분석 결과에 대한 해석, 평가, 활용
2. CRISP-DM (Cross Industry Standard Process for Data Mining) 분석 방법론
- 1996년 유럽 연합의 ESPRIT 프로젝트에서 시작
- 계층적 프로세스 모델로 4개 레벨로 구성
- 분석 절차
- 업무 이해 (Business Understanding) : 비즈니스 관점 프로젝트의 목적과 요구사항 이해, 초기 프로젝트 계획 수립
- 데이터 이해 (Data Understanding) : 분석을 위한 데이터 수집, 데이터 속성 이해, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
- 데이터 준비 (Data Preparation) : 분석 기법에 적합한 데이터셋 선택, 데이터 정제, 통합, 포맷팅
- 모델링 (Modeling) : 모델링 기법과 알고리즘 선택, 파라미터 최적화, 과적합( Overfitting) 발견
- 평가 (Evaluation) : 모델이 프로젝트의 목적에 부합하는지 평가, 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가
- 전개 (Deployment) : 완성된 모델을 실제 업무에 적용하기 위한 계획 수립 및 유지 보수 계획 마련, 프로젝트 종료 보고서 작성, 프로젝트 리뷰
3. KDD vs CRISP-DM
KDD | CRISP-DM |
분석 대상 비즈니스 이해 | 업무 이해 (Business Understanding) |
데이터셋 선택 (Selection) | 데이터 이해 (Data Understanding) |
데이터 전처리 (Preprocessing) | |
데이터 변환 (Transformation) | 데이터 준비 (Data Preparation) |
데이터 마이닝 (Data Mining) | 모델링 (Modeling) |
데이터 마이닝 결과 평가 (Interpretation/Evaluation) | 평가 (Evaluation) |
데이터 마이닝 활용 | 전개 (Deployment) |
4. 빅데이터 분석 방법론
5. 분석 기획 (Planning)
- 1) 비즈니스 이해 및 범위 설정
- 비즈니스 이해 : 비즈니스 자료 조사
- 프로젝트 범위 설정 : 프로젝트에 참여하는 관계자들 (Stakeholders)의 이해를 일치시키기 위하여 구조화된 프로젝트 범위 정의서인 SOW (Statement of Work) 작성
- 비즈니스 이해 : 비즈니스 자료 조사
- 2) 프로젝트 정의 및 계획 수립
- 데이터 분석 프로젝트 정의 : 프로젝트 목표 및 KPI (핵심 성과 지표), 목표 수준 등을 구체화, 모델 이미지 평가 기준 설정
- 프로젝트 수행 계획 수립 : 프로젝트 수행 계획서 작성하는 단계, 프로젝트의 목적 및 배경, 기대효과, 수행 방법, 일정 및 추진 조직
- WBS 작성 : 전체업무의 구성 요소를 만든 후 각 요소 평가하고 일정별로 계획하며 완수 할 수 있는 사람에게 할당해주는 역할을 함
- 3) 프로젝트 위험 계획 수립
- 데이터 분석 위험 식별, 계획 수립 단계에서 발생 가능한 모든 위험을 식별, 식별된 위험의 우선순위 설정
- 위험 대응 계획 수립 : 회피 (Avoid), 전이 (Transfer), 완화 (Mitigate), 수용 (Accept)로 구분하여 위험 관리 계획서 작성
6. 데이터 준비 (Preparing)
- 1) 필요 데이터 정의
- 데이터 정의 : 데이터 정의서 작성 (메타데이터 정의서), ERD (Entity Relationship Diagram)
- 데이터 획득 방안 수립
- 2) 데이터 스토어 설계
- 정형 데이터 스토어 설계 : 관계형데이터베이스 (RDBMS) 이용, 데이터 매핑 정의서
- 비정형 데이터 스토어 설계 : 하둡, NoSQL 이용
- 3) 데이터 수집 및 정합성 점검
- 데이터 수집 및 저장 : ETL (Extract Transform Load)로 데이터 수집 (ex. 크롤러)
- 데이터 정합성 (무결성) 점검
7. 데이터 분석 (Analyzing)
- 1) 분석용 데이터 준비
- 비즈니스 룰 확인 : 비즈니스 이해, 도메인 문제점 인식, 프로젝트 정의 등을 통해 프로젝트 목표 정확히 인식
- 분석용 데이터셋 준비 : 데이터 스토어로부터 분석에 필요한 정형, 비정형 데이터 추출
- 2) 텍스트 분석
- 어휘/구문 분석 (Word Analysis)
- 감정 분석 (Sentimental Analysis)
- 토픽 분석 (Topic Analysis)
- 오피니언 분석 (Opinion Analysis)
- 소셜 네트워크 분석 (SNA)
- 3) 탐색적 분석 (EDA)
- 기초 통계량 산출, 데이터 분포와 변수간의 관계 파악, 데이터 시각화
- 4) 모델링 (Modeling)
- 데이터 분할 : 훈련용 데이터셋과 테스트용 데이터셋으로 분리하여 과적합 방지
- 데이터 모델링 : 모델 적용 및 운영 방안 : 모델에 대한 상세한 알고리즘 작성
- 5) 모델 평가 및 검증 : 테스트 데이터셋을 이용하여 모델 검증 작업 실시, 보고서 작성
8. 시스템 구현 (Developing)
- 시스템 분석 및 설계 구현
- 시스템 테스트 및 운영 : 단위테스트, 통합테스트, 시스템 테스트 실시
9. 평가 및 전개 (Deploying)
- 모델 발전 계획 수립
- 프로젝트 평가 보고 : 프로젝트의 성과를 정량적, 정성적으로 평가 하고 최종보고서 작성
[분석 과제 발굴]
- 분석 과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 이해관계자들이 이해하고 프로젝트로 수행할 수 있는 과제정의서 형태로 도출된다.
- 분석 과제를 도출하기 위한 방식은 크게 2가지로 나누어진다.
- 하향식 접근 방식 (Top Down Approach) : 문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화되어 수행하는 방식
- 상향식 접근 방식 (Bottom Up Approach) : 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결 방안을 탐색하고 이를 지속적으로 개선하는 방식
1. 하향식 접근법 (Top Down Approach)
- 가. 문제 탐색 (Problem Discovery) 단계
- 1) 비즈니스 모델 기반 문제 탐색
- 기업 내, 외부 환경을 포괄하는 비즈니스 모델이라는 틀을 활용하여 가치가 창출될 문제를 누락없이 도출할 수 있다.
- 비즈니스 모델 관점에서는 해당기업의 사업 모델을 도식화한 비즈니스 모델 캔버스의 9가지 블록을 단순화하여 업무, 제품, 고객 단위로 문제를 발굴하고, 이를 관리하는 두 가지 영역인 규제와 감사영역과 지원 인프라 영역에 대한 기회를 추가로 도출하는 작업을 수행한다.
- 업무 (Operation) : 제품 및 서비스를 생산하기 위해서 운영하는 내부 프로세스 및 주요 자원 관련 주제 도출
- ex) 생산 공정 최적화, 재고량 최소화 등
- 제품 (Product) : 생산 및 제공하는 제품, 서비스를 개선하기 위해 관련 주제 도출
- ex) 제품의 주요 기능 개선, 서비스 모니터링 지표 도출 등
- 고객 (Customer) : 제품, 서비스를 제공받는 사용자 및 고객, 이를 제공하는 채널의 관점에서 관련 주제 도출
- ex)고객 Call 대기 시간 최소화, 영업점 위치 최적화 등
- 규제와 감사 (Regulation & Audit) : 제품 생산 및 전달 과정 프로세스 중에서 발생하는 규제 및 보안의 관점에서 주제 도출
- ex) 제공 서비스 품질의 이상 징후 관리, 새로운 환경 규제 시 예상되는 제품 추출 등
- 지원 인프라 (IT & Human Resource) : 분석을 수행하는 시스템 영역 및 이를 운영, 관리하는 인력의 관점에서 주제 도출
- ex) EDW 최적화, 적정 운영 인력 도출 등
- 분석 기회 발굴의 범위 확장
- (1) 메가트렌드 : 사회,기술,경제,환경,정치 영역으로 나누어서 좀 더 폭넓기 기회 탐색을 수행(STEEP)
- (2) 경쟁사의 동향 : 현재 수행 사업 영역의 직접 경쟁사 및 제품,서비스 뿐만 아니라 대체제와 신규 진입자 등으로 관점을 확대하여 위험이 될 수 있는 상황에 대한 분석 기회 발굴의 폭을 넓혀서 탐색
- (3) 고객 (시장) 니즈의 변화 : 직접 고객 및 채널, 고객의 구매와 의사결정에 영향을 미치는 영향자들에 대한 폭넓은 관점을 바탕으로 분석 기회를 탐색
- (4) 역량의 변화 (재해석) : 현재 해당 조직 및 기업 역량 뿐만 아니라 해당 조직의 비즈니스에 영향을 끼치는 파트너 네트워크를 포함한 활용 가능 역량을 토대로 폭넓은 분석 기회를 탐색
- 2) 외부 참조 모델 기반 문제 탐색
- 유사, 동종 사례 벤치마킹을 통한 분석기회 발굴은 제공되는 산업별, 업무 서비스별 분석테마 후보 그룹을 통해 Quick & Easy 방식으로 필요한 분석 기회가 무엇인지에 대한 아이디어를 얻고 기업에 적용할 분석테마 후보 목록을 워크숍 형태의 브레인스토밍을 통해 빠르게 도출하는 방법이다.
- 3) 분석 유즈 케이스 (Analytics Use Case) 정의
- 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써
향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용하도록 한다.
- 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써
- 1) 비즈니스 모델 기반 문제 탐색
- 나. 문제 정의 (Problem Definition) 단계
- 특정 문제 수행을 달성하기 위해 필요한 데이터 및 기법 (How)를 정의하기 위한 데이터 분석의 문제로의 변환 수행
- "고객 이탈의 증대" 라는 비즈니스 문제는 "고객 이탈에 영향을 미치는 요인을 식별, 이탈 가능성을 예측"하는 분석 문제로 변환 될 수 있음
- 다. 해결방안 탐색 (Solution Search) 단계
- 동일 데이터라도 어떤 시스템을 활용할 것인지에 따라 소요되는 예산 및 도구가 달라짐
- 기존 시스템 개선, 교육 및 채용을 통한 역량 확보, 시스템 고도화, 전문업체 소싱 등
- 라. 타당성 검토 (Feasibility Study) 단계
- (1) 경제적 타당성
- (2) 데이터 및 기술적 타당성
2. 상향식 접근법 (Bottom Up Approach)
- 1) 기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론
- 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 문제를 도출하는 일련의 과정
- 새로운 문제 탐색에는 하향식 접근법이 맞지 않음
- 스탠포드 대학의 d.school은 디자인 사고 접근법을 통한 분석 방법 제시
- 이미 우리가 알고 있는 것, 즉 분석가의 문제에 대한 분석 접근법의 한계를 극복하기 위해 현장 관찰과 감정이입, 즉 대상의 관점으로부터의 전환을 수행
- 2) 지도 학습 / 비지도 학습
- 일반적으로 상향식 접근 방식의 데이터 분석은 비지도 학습 (Unsupervised Learning)방법에 의해 수행된다.
- 비지도 학습은 데이터 분석의 목적이 명확히 정의된 형태의 특정 필드의 값을 구하는 것이 아니라 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현하는 것이다.
- 이와 반대로 명확한 목적하에 데이터분석을 실시하는 것은 지도 학습 (Supervised Learning)이라고하며 분류, 추측, 예측, 최적화를 통해 사용자의 주도 하에 분석을 실시하고 새로운 데이터를 예측하는 것이다.
- 프로토타이핑의 필요성
- (1) 문제에 대한 인식 수준 : 문제 정의가 불명확하거나 새로운 문제일 경우 프로토타아이핑으로 이해 및 구체화에 도움 받을 수 있음
- (2) 필요 데이터 존재 여부의 불확실성 : 불가능한 프로젝트를 수행하는 리스크 사전 방지
- (3) 데이터의 사용 목적의 가변성 : 데이터의 사용 목적과 범위 확대 가능
- 3. 분석과제 정의
- 다양한 방식을 통해서 도출한 분석과제를 분석과제 정의서 양식을 활용하여 보다 상세하게 정의
- 분석과제 정의서를 통해 분석별로 필요한 소스 데이터, 분석방법, 데이터 입수 및 분석의 난이도, 분석수행 주기, 분석결과에 대한 검증 오너십, 상세 분석 과정 등을 정의
- 분석 데이터 소스는 내,외부의 비구조적인 데이터와 소셜 미디어 및 오픈 데이터까지 범위를 확장하여 고려하고 분석방법 또한 상세하게 작성한다
- 분석 프로젝트 관리 방안
- 분석 과제의 주요 5가지 특성 및 주요 관리 영역
- 1) Data Size : 분석하고자 하는 데이터의 양을 고려한 관리 방안 수립이 필요
- 2) Data Complexity : 초기 데이터의 확보와 통합 뿐 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요. 정형/비정형 등의 차이 등
- 3) Speed : 분석 결과가 도출되었을 때 이를 활용하는 시나리오 측면에서의 속도를 고려해야 한다.
일단위, 주단위 실적은 배치 형태로 작업해도 무방하나, 실시간으로 사기(Fraud)를 탐지하거나 고객에게 개인화된 상품, 서비스를 추천하는 경우에는 분석 모델의 적용 및 계산이 실시간으로 수행되어야 함 - 4) Analytic Complexity : 분석 모델의 정확도와 복잡도는 트레이드 오프 관계가 존재함.
이에 대한 기준점을 사전에 정의해 두어야 한다. - 5) Accuracy & Precision
- Accuracy는 모델과 실제 값 차이가 적다는 정확도를 의미함. 분석의 활용적인 측면에서 중요
- Precision은 모델을 지속적으로 반복했을때의 편차의 수준으로써 일관적으로 동일한 결과를 제시한다는 것을 의미함. 분석의 안정성 측면에서 중요
- 서로 간의 트레이드 오프 관계이므로 모델의 해석 및 적용시 사전에 고려해야함
- 분석 과제의 주요 5가지 특성 및 주요 관리 영역
1. 분석 프로젝트의 특성
- 데이터 영역과 비즈니스 영역에 대한 이해뿐만 아니라 지속적인 반복이 요구되는 분석 프로세스의 특성을 이해한 프로젝트 관리방안을 수립하는 것이 중요함
- 분석과제 정의서를 기반으로 프로젝트를 시작하되 지속적인 개선 및 변경을 염두에 두고 기간 내에 가능한 최선의 결과를 도출할 수 있도록 프로젝트 구성원들과 협업하는 것이 특징임
2. 분석 프로젝트 관리 방안
- 프로젝트 관리 지침 가이드
- 통합 : 프로젝트와 관련된 다양한 활동과 프로세스를 도출, 정의, 결합, 단일화, 조정, 통제, 종료에 필요한 프로세스
- 이해관계자 : 프로젝트 스폰서, 고객사, 기타 이해관계자를 식별하고 관리하는데 필요한 프로세스
- 범위 : 작업과 인도물을 식별하고 정의하는데 요구되는 프로세스
- 자원 : 인력, 시설, 장비, 자재, 기반 시설, 도구와 같은 적절한 프로젝트 자원을 식별하고 확보하는데 필요한 프로세스
- 시간 : 프로젝트 활동의 일정을 수립하고 일정 통제의 진척상황을 관찰하는데 요구되는 프로세스
- 원가 : 예산 개발과 원가통제의 진척상황을 관찰하는데 요구되는 프로세스를 포함
- 리스크 : 위험과 기회를 식별하고 관리하는 프로세스
- 품질 : 품질보증과 품질통제를 계획하고확립하는데 요구되는 프로세스
- 조달 : 계획에 요구된 프로세스를 포함하며 제품 및 서비스 또는 인도물을 인수하고 공급자와의 관계를 관리하는데 요구되는 프로세스
- 의사소통 : 프로젝트와 관련된 정보를 계획, 관리, 배포하는데 요구되는 프로세스
[분석 마스터 플랜]
1. 분석 마스터 플랜 수립 프레임워크
- 중/장기적 관점의 마스터 플랜 수립을 위해서는 분석 과제를 대상으로 전략적 중요도, 비즈니스 성과 및 ROI, 분석 과제의 실행 용이성 등 다양한 기준을 고려해 적용할 우선순위를 설정할 필요가 있다.
- 분석 과제의 우선순위뿐 아니라 분석의 적용 범위 및 방식에 대해서도 종합적으로 고려하여 데이터 분석을 실행하기 위한 로드맵을 수립한다.
- 분석 마스터 플랜 수립 개요
2. 수행 과제 도출 및 우선순위 평가
- 우선순위 평가는 정의된 데이터 과제에 대한 실행 순서를 정하는 것이다
- ROI 관점으로 살펴본 빅데이터의 4V
- 크기 (Volume)
- 다양성 (Variety)
- 속도 (Velocity)
- 가치 (Value)
- ROI 관점에서 우선순위 평가 기준
- 시급성의 판단 기준은 전략적 중요도가 핵심이며, 이는 현재의 관점에 전략적 가치를 둘 것인지 미래의 중/장기적 관점에 전략전인 가치를 둘 것인지에 적정 시기를 고려하여 시급성 여부를 판단할 수 있다.
- 난이도는 현 시점에서 과제를 추진하는 것이 비용 측면과 범위 측면에서 바로 적용하기 쉬운 (Easy) 것인지 또는 어려운 (Difficult) 것인지에 대한 판단 기준이다.
- 분석 과제 우선순위 선정 매트릭스 (포트폴리오 4분면 분석)
- ① 전략적 중요도가 높아 경영에 미치는 영향이 크므로 현재 시급하게 추진이 필요함
난이도가 높아 현재 수준에서 과제를 바로 적용하기에 어려움 - ② 현재 시점에서는 전략적 중요도가 높지 않지만 중장기적 관점에서는 반드시 추진되어야 함
분석과제를 바로 적용하기에는 난이도가 높음 - ③ 전략적 중요도가 높아 현재 시점에 전략적 가치를 두고 있음
과제 추진의 난이도가 어렵지 않아 우선적으로 바로 적용 가능함 - ④ 전략적 중요도가 높지 않아 중장기적 관점에서 과제 추진이 바람직함
과제를 바로 적용하는 것은 어렵지 않음
- ① 전략적 중요도가 높아 경영에 미치는 영향이 크므로 현재 시급하게 추진이 필요함
- 이행 계획 수립
- 로드맵 수립
- 단계별로 추진하고자 하는 목표를 명확히 정의하고 추진 과제별 선.후행 관계를 고려하여 단계별 추진 내용을 정렬한다.
- 세부 이행계획 수립
- 데이터 분석 체계는 고적적인 폭포수 (Waterfall) 방식도 있으나 반복적인 정련과정을 통하여 프로젝트의 완성도를 높이는 방식을 주로 사용한다.
- 로드맵 수립
[분석 거버넌스 체계 수립]
1. 거버넌스 체계 개요
- 분석 거버넌스는 기업에서 데이터가 어떻게 관리되고, 유지되고, 규제 되는지에 대한 내부적인 관리 방식이나 프로세스를 의미한다.
- 거버넌스 (governance)
- 국가경영, 공공경영이라고 해석이 되며, 행정까지도 포함하는 용어
- 기업에서는 경영목표를 충족시킬 수 있는 계획을 개발하고 통제하는 프로세스를 의미
- 거버넌스 (governance)
2. 데이터 분석 수준 진단
- 1) 분석 준비도
- 분석 준비도 프레임워크
- ⓐ 분석업무파악: 발생한 사실 분석 업무, 예측/시뮬레이션/최적화 분석 업무, 분석 업무 정기 개선
- ⓑ 인력 및 조직: 분석 전문가 직무 존재, 분석 전문가 교육 훈련 프로그램, 관리자들의 기본적 분석 능력, 전사 분석업무 총괄 조직 존재, 경영진의 분석 업무 이해 능력
- ⓒ 분석 기법: 업무별 적합한 분석기법 사용, 분석 업무 도입 방법론, 분석기법 라이브러리/효과성 평가/정기적 개선
- ⓓ 분석 데이터 : 데이터 충분성/신뢰성/적시성, 비구조적 데이터 관리, 외부 데이터 활용 체계, 기준 데이터 관리(MDM)
- ⓔ 분석 문화 : 사실에 근거한 의사결정, 관리자의 데이터 중시, 데이터 활용, 경영진의 직관보다 데이터, 데이터 공유 및 협업 문화
- ⓕ IT인프라 : 운영시스템 데이터 통합, 데이터 유통체계, 분석 전용 서버 및 스토리지, 빅데이터 분석 환경, 통계 분석 환경, 비쥬얼 분석 환경
- 분석 준비도 프레임워크
3. 분석 성숙도 모델
- CMMI (Capability Maturity Model Integration) 모델
- 시스템 개발 업무 능력과 조직의 성숙도를 파악하기 위해 사용하는 모델
단계 | 도입 | 활용 | 확산 | 최적화 |
설명 | 분석을 시작하여 환경과 시스템을 구축 | 분석 결과를 실제 업무에 적용 | 전사 차원에서 분석을 관리하고 공유 | 분석을 진화시켜서 혁신 및 성과 향상에 기여 |
비즈니스 부문 |
실적분석 및 통계 |
미래결과 예측/시뮬레이션 | 전사 성과 실시간 분석/분석규칙 관리 | 외부환경 분석/ 최적화 업무 적용/ 실시간 분석 |
조직역량 | 담당자 역량 의존 | 전문 부서 수행 | 모든 부서 수행 | 데이터 사이언스 그룹 |
IT 부문 | 데이터 웨어하우스 | 실시간 대시보드 | 비주얼 분석 | 분석 협업환경 |
4. 분석 수준 진단 결과
- ⓐ 정착형 : 준비도는 낮으나 조직/인력/분석업무/분석기법 등을 기업 내부에서 제한적으로 사용하고 있어 1차적으로 정착이 필요한 기업
- ⓑ 확산형 : 기업에 필요한 6가지 분석 구성요소를 갖추고 있고, 현재 부분적으로 도입되어 지속적인 확산이 필요한 기업
- ⓒ 준비형 : 기업에 필요한 데이터/인력/조직/분석업무/분석기법 등이 적용되지 않아 사전 준비가 필요한 기업
- ⓓ 도입형 : 기업에서 활용하는 분석업무/기법 등은 부족하지만 적용 조직 등 준비도가 높아 바로 도입할 수 있는 기업
5. 분석 지원 인프라 방안 수립
- 분석 과제 단위별로 별도의 분석 시스템을 구축하는 경우, 관리의 복잡도 및 비용의 증대라는 부작용이 나타나게 된다.
- 따라서 분석 마스터 플랜을 기획하는 단계에서부터 장기적으로 안정적으로 활용할 수 있는 확장성을 고려한 플랫폼 구조를 도입하는 것이 적절하다.
6. 데이터 거버넌스 체계 수립
- 빅데이터는 데이터의 크기 (Volume)로 그 의미의 절대성을 갖는 것은 아니다.
- 그러나 실시간으로 쏟아지는 엄청난 양의 데이터와 정형화된 데이터를 넘어 비정형/반정형의 데이터는 조직이나 프로젝트 단위의 데이터 관리체계로는 그 해답을 찾을 수 없음
- 전사 차원의 체계적인 데이터 거버넌스 (Data Governace)의 필요성을 부각시키고 있음
- 데이터 거버넌스의 중요한 관리대상
- 마스터 데이터 (Master Data)
- 메타 데이터 (Meta Data)
- 데이터 사전 (Data Dictionary)
- 데이터 거버넌스의 구성요소
- 원칙 (Principle) : 데이터를 유지 관리하기 위한 지침과 가이드
- 조직 (Organization) : 데이터를 관리할 조직의 역할과 책임
- 프로세스 (Process) : 데이터 관리를 위한 활동과 체계
- 데이터 거버넌스 체계 요소
- 데이터 표준화 : 명명규칙수립, 메타데이터 구축, 데이터사전 구축
- 데이터 관리 체계 : 메타데이터와 데이터 사전의 관리 원칙을 수립
- 데이터 저장소관리 (Repository)
- 표준화 활동
7. 데이터 조직 및 인력방안 수립
- 빅데이터의 등장에 따라 기업의 비즈니스도 많은 변화를 겪고 있다.
- 이러한 비즈니스 변화를 인식하고 기업의 차별된 경쟁력을 확보하는 수단으로 데이터 과제 발굴, 기술 검토 및 전사 업무 적용 계획 수립 등 데이터를 효과적으로 분석
- 또한 활용하기 위해 기획, 운영 및 관리를 전담할 수 있는 전문 분석 조직의 필요성이 제기되고 있다.
- 데이터 분석을 위한 3가지 조직 구조
- ⓐ 집중구조
- 전사 분석업무를 별도의 분석전담 조직에서 담당
- 전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행가능
- 현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
- ⓑ 기능구조
- 일반적인 분석 수행 구조
- 별도의 분석조직이 없고 해당 업무 부서에서 분석 수행
- 전사적 핵심분석이 어려우며, 부서 현황 및 실적 통계 등 과거실적에 국한된 분석 수행 가능성 높음
- ⓒ 분산구조
- 분석조직 인력들은 현업부서로 직접 배치하여 분석업무 수행
- 전사차원의 우선순위 수행
- 분석결과에 따른 신속한 Action 가능
- 베스트 practice 공유 가능
- 부서 분석업무와 역할 분담이 명확해야 함
- ⓐ 집중구조
- 분석조직 인력구성의 예
- ⓐ 비지니스 인력 : 해당 비지니스를 잘 이해하고 분석 요소를 찾고 협의 할 수 있는 인력
- ⓑ IT기술 인력 : 분석에 필요한 IT기술동향을 파악하고 필요한 기술 아키텍처를 수립할 수 있는 인력
- ⓒ 분석전문 인력 : 고급 통계 분석 기법을 이해하고 다양한 예측 모델링을 설계/검증할 수 있는 인력
- ⓓ 변화관리 인력 : 경영층 대상으로 분석문화 확산을 위한 변화관리를 담당하는 인력
- ⓔ 교육담당 인력 : 분석조직에게 다양한 분석기법에 대한 심도있는 교육을 할 수 있는 인력
- 변화관리 인력, 교육담당 인력은 겸직 가능
8. 분석 과제 관리 프로세스 수립
- 분석 과제 관리 프로세스는 크게 과제 발굴과 과제 수행 및 모니터링으로 나누어진다.
- 과제 발굴 단계 : 개별 조직이나 개인이 도출한 분석 아이디어를 발굴하고 이를 과제화하여 분석 과제 풀 (Pool)로 관리하면서 분석 프로젝트를 선정하는 작업을 수행한다.
- 과제 수행 단계 : 분석을 수행할 팀을 구성하고 분석 과제 실행 시 지속적인 모니터링과 과제 결과를 공유하고 개선하는 절차를 수행한다.
9. 분석 교육 및 변화관리
- 기업에 맞는 적합한 분석 업무를 도출하고 가치를 높혀 줄 수 있도록 분석 조직 및 인력에 대한 지속적인 교육과 훈련을 실시해야 함.
- 경영층이 사실 기반 의사결정을 할 수 있도록 문화를 정착시키는 등 지속적인 변화관리를 계획하고 수행해야 함
참고 문헌
[논문]
- 없음
[보고서]
- 없음
[URL]
- 없음
문의사항
[기상학/프로그래밍 언어]
- sangho.lee.1990@gmail.com
[해양학/천문학/빅데이터]
- saimang0804@gmail.com
'자기계발 > 자격증' 카테고리의 다른 글
[자격증] 데이터분석 전문가 (ADP) 필기 : 제5과목 데이터 시각화 (0) | 2022.10.27 |
---|---|
[자격증] 데이터분석 전문가 (ADP) 필기 : 제4과목 데이터 분석 (0) | 2022.10.27 |
[자격증] 데이터분석 전문가 (ADP) 필기 : 제2과목 데이터 처리 기술 이해 (1) | 2022.10.15 |
[자격증] 데이터분석 전문가 (ADP) 필기 : 제1과목 데이터 이해 (1) | 2022.10.15 |
[자격증] 정보처리기사 필기 : 제5과목 정보시스템 구축 (시스템 보안 구축) (0) | 2021.03.03 |
최근댓글