정보

    • 업무명     : 데이터분석 전문가 (ADP) 필기 : 제3과목 데이터 분석 기획
    • 작성자     : 이상호
    • 작성일     : 2022.10.27
    • 설   명      :
    • 수정이력 :

     

     

     내용

    [데이터 분석 기획의 이해]

    1. 분석 기획 방향성 도출

    • 분석 기획의 특징
      • 분석 기획 : 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출 할 수 있도록 이를 적절하게 관리 할 수 있는 방안을 사전에 계획하는 작업
      • 분석기획을 하기 위해서는 컴퓨터 사이언스, 수학 및 통계학 지식, 비즈니스 분석 능력에 대한 고른 역량과 시각이 필요

    2. 분석 주제 유형 (4가지 유형을 융합적으로 반복)

    • 최적화 (Optimization) : 분석 대상 및 분석 방법을 이해하고 현 문제를 최적화의 형태로 수행
    • 솔루션 (Solution) : 분석 과제는 수행되고, 분석 방법을 알지 못하는 경우 솔루션을 찾는 방식으로 분석과제 수행
    • 통찰 (Insight) : 분석 대상이 불분명하고, 분석 방법을 알고 있는 경우 인사이트 도출
    • 발견 (Discovery) : 분석 대상, 방법을 모른다면 발견을 통하여 분석 대상 자체를 새롭게 도출
                                      분석대상

    분석방법
    Known Un-Known
    Known 최적화(Optimization) 통찰(Insight)
    Un-Known 솔루션(Solution) 발견(Discovery)

     

    3. 목표 시점별 분석 기획 방안

    • 과제 중심적인 접근 방식 : 당면한 과제를 빠르게 해결
    • 장기적인 마스터 플랜 방식 : 지속적인 분석 내재화
    • 서로 간의 융합적으로 적용하는 것이 바람직함
    • cf) Quick-win (즉각적인 실행을 통한 성과 도출)  
      • 프로세스 진행과정에서 일반적인 상식과 경험으로 원인이 명백한 경우 불합리한 요소를 개선 단계까지 미루지 않고, 즉시 개선함으로써 과제를 단기로 달성하고 추진하는 과정
    당면한 분석 주제의 해결
    (과제 단위)
      지속적 분석 문화 내재화
    (마스터 플랜 단위)
    Speed & Test <1차 목표> Accuracy & Deploy
    Quick-Win <과제의 유형> Long Term View
    Problem Solving <접근 방식> Problem Definition

     

    4. 분석 기획 시 고려 사항

    • 가용한 데이터
      • 분석을 위한 데이터 확보가 필수적이다.
      • 데이터 유형에 따라 적용가능한 솔루션 및 분석 방법이 다르기 때문에 데이터 유형에 대한 분석이 선행적으로 이루어져야 한다.
    • 적절한 유스케이스 (Proper Use-Case) 탐색  
      • 유사 분석 시나리오 및 솔루션이 있다면 이를 최대한 활용하는 것이 중요하다.
    • 장애 요소들에 대한 사전 계획 수립이 필요 (Low Barrier of Execution)
      • 정확도를 올리기 위한 비용 사전 고려
      • 조직의 역량 내재화를 위한 충분하고 계속적인 교육 및 활용 방안 등의 변화관리 (Change Management)가 고려되어야 한다.

     

    [분석 방법론]

    1. KDD (Knowledge Discovery in Database) 분석 방법론

    • 1996년 Fayyad가 체계적으로 정리한 데이터 마이닝 프로세스
    • 데이터 마이닝, 기계학습, 인공지능, 패턴인식, 데이터 시각화 등에서 응용될 수 있는 구조를 가짐
    • 분석 절차
      • 분석 대상의 비즈니스 도메인에 대한 이해와 프로젝트 목표를 정확하게 설정
      • 데이터셋 선택 (Selection)
      • 데이터 전처리 (Preprocessing) : 잡음 (Noise), 이상값 (Outlier), 결측치 (Missing value) 제거
      • 데이터 변환 (Transformation) : 변수 선택, 차원 축소 등
      • 데이터 마이닝 (Data Mining) : 분석 목적에 맞는 데이터 마이닝 기법 알고리즘 선택, 데이터 패턴 찾기, 데이터 분류, 예측 작업 시행
      • 데이터 마이닝 결과 평가 (Interpretation/Evaluation) : 분석 결과에 대한 해석, 평가, 활용

     

    2. CRISP-DM (Cross Industry Standard Process for Data Mining) 분석 방법론

    • 1996년 유럽 연합의 ESPRIT 프로젝트에서 시작
    • 계층적 프로세스 모델로 4개 레벨로 구성
    • 분석 절차
      • 업무 이해 (Business Understanding) : 비즈니스 관점 프로젝트의 목적과 요구사항 이해, 초기 프로젝트 계획 수립
      • 데이터 이해 (Data Understanding) : 분석을 위한 데이터 수집, 데이터 속성 이해, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
      • 데이터 준비 (Data Preparation) : 분석 기법에 적합한 데이터셋 선택, 데이터 정제, 통합, 포맷팅
      • 모델링 (Modeling) : 모델링 기법과 알고리즘 선택, 파라미터 최적화, 과적합( Overfitting) 발견
      • 평가 (Evaluation) : 모델이 프로젝트의 목적에 부합하는지 평가, 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가
      • 전개 (Deployment) : 완성된 모델을 실제 업무에 적용하기 위한 계획 수립 및 유지 보수 계획 마련, 프로젝트 종료 보고서 작성, 프로젝트 리뷰

    3. KDD vs CRISP-DM

    KDD CRISP-DM
    분석 대상 비즈니스 이해 업무 이해 (Business Understanding)
    데이터셋 선택 (Selection) 데이터 이해 (Data Understanding) 
    데이터 전처리 (Preprocessing)
    데이터 변환 (Transformation) 데이터 준비 (Data Preparation)
    데이터 마이닝 (Data Mining) 모델링 (Modeling)
    데이터 마이닝 결과 평가 (Interpretation/Evaluation) 평가 (Evaluation)
    데이터 마이닝 활용 전개 (Deployment)

     

    4. 빅데이터 분석 방법론

     

    5. 분석 기획 (Planning)

    • 1) 비즈니스 이해 및 범위 설정
      • 비즈니스 이해 : 비즈니스 자료 조사
        • 프로젝트 범위 설정 : 프로젝트에 참여하는 관계자들 (Stakeholders)의 이해를 일치시키기 위하여 구조화된 프로젝트 범위 정의서인 SOW (Statement of Work) 작성
    • 2) 프로젝트 정의 및 계획 수립
      • 데이터 분석 프로젝트 정의 : 프로젝트 목표 및 KPI (핵심 성과 지표), 목표 수준 등을 구체화, 모델 이미지 평가 기준 설정  
      • 프로젝트 수행 계획 수립 : 프로젝트 수행 계획서 작성하는 단계, 프로젝트의 목적 및 배경, 기대효과, 수행 방법, 일정 및 추진 조직
      • WBS 작성 : 전체업무의 구성 요소를 만든 후 각 요소 평가하고 일정별로 계획하며 완수 할 수 있는 사람에게 할당해주는 역할을 함
    • 3) 프로젝트 위험 계획 수립
      • 데이터 분석 위험 식별, 계획 수립 단계에서 발생 가능한 모든 위험을 식별, 식별된 위험의 우선순위 설정  
      • 위험 대응 계획 수립 : 회피 (Avoid), 전이 (Transfer), 완화 (Mitigate), 수용 (Accept)로 구분하여 위험 관리 계획서 작성

    6. 데이터 준비 (Preparing)

    • 1) 필요 데이터 정의
      • 데이터 정의 : 데이터 정의서 작성 (메타데이터 정의서), ERD (Entity Relationship Diagram)  
      • 데이터 획득 방안 수립
    • 2) 데이터 스토어 설계  
      • 정형 데이터 스토어 설계 : 관계형데이터베이스 (RDBMS) 이용, 데이터 매핑 정의서
      • 비정형 데이터 스토어 설계 : 하둡, NoSQL 이용
    • 3) 데이터 수집 및 정합성 점검
      • 데이터 수집 및 저장 : ETL (Extract Transform Load)로 데이터 수집 (ex. 크롤러)
      • 데이터 정합성 (무결성) 점검

    7. 데이터 분석 (Analyzing)

    • 1) 분석용 데이터 준비
      • 비즈니스 룰 확인 : 비즈니스 이해, 도메인 문제점 인식, 프로젝트 정의 등을 통해 프로젝트 목표 정확히 인식
      • 분석용 데이터셋 준비 : 데이터 스토어로부터 분석에 필요한 정형, 비정형 데이터 추출
    • 2) 텍스트 분석
      • 어휘/구문 분석 (Word Analysis)
      • 감정 분석 (Sentimental Analysis)
      • 토픽 분석 (Topic Analysis)
      • 오피니언 분석 (Opinion Analysis)
      • 소셜 네트워크 분석 (SNA)
    • 3) 탐색적 분석 (EDA)
      • 기초 통계량 산출, 데이터 분포와 변수간의 관계 파악, 데이터 시각화
    • 4) 모델링 (Modeling)
      • 데이터 분할 : 훈련용 데이터셋과 테스트용 데이터셋으로 분리하여 과적합 방지
      • 데이터 모델링 : 모델 적용 및 운영 방안 : 모델에 대한 상세한 알고리즘 작성
    • 5) 모델 평가 및 검증 : 테스트 데이터셋을 이용하여 모델 검증 작업 실시, 보고서 작성

     

    8. 시스템 구현 (Developing)

    • 시스템 분석 및 설계 구현
    • 시스템 테스트 및 운영 : 단위테스트, 통합테스트, 시스템 테스트 실시

     

    9. 평가 및 전개 (Deploying)

    • 모델 발전 계획 수립
    • 프로젝트 평가 보고 : 프로젝트의 성과를 정량적, 정성적으로 평가 하고 최종보고서 작성

     

    [분석 과제 발굴]

    • 분석 과제는 풀어야 할 다양한 문제를 데이터 분석 문제로 변환한 후 이해관계자들이 이해하고 프로젝트로 수행할 수 있는 과제정의서 형태로 도출된다.
    • 분석 과제를 도출하기 위한 방식은 크게 2가지로 나누어진다.
    • 하향식 접근 방식 (Top Down Approach) : 문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화되어 수행하는 방식
    • 상향식 접근 방식 (Bottom Up Approach) : 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결 방안을 탐색하고 이를 지속적으로 개선하는 방식

     

    1. 하향식 접근법 (Top Down Approach)

    • 가. 문제 탐색 (Problem Discovery) 단계 
      • 1) 비즈니스 모델 기반 문제 탐색
        • 기업 내, 외부 환경을 포괄하는 비즈니스 모델이라는 틀을 활용하여 가치가 창출될 문제를 누락없이 도출할 수 있다.
        • 비즈니스 모델 관점에서는 해당기업의 사업 모델을 도식화한 비즈니스 모델 캔버스의 9가지 블록을 단순화하여 업무, 제품, 고객 단위로 문제를 발굴하고, 이를 관리하는 두 가지 영역인 규제와 감사영역과 지원 인프라 영역에 대한 기회를 추가로 도출하는 작업을 수행한다. 
        • 업무 (Operation) : 제품 및 서비스를 생산하기 위해서 운영하는 내부 프로세스 및 주요 자원 관련 주제 도출
          • ex) 생산 공정 최적화, 재고량 최소화 등 
        • 제품 (Product) : 생산 및 제공하는 제품, 서비스를 개선하기 위해 관련 주제 도출
          • ex) 제품의 주요 기능 개선, 서비스 모니터링 지표 도출 등 
        • 고객 (Customer) : 제품, 서비스를 제공받는 사용자 및 고객, 이를 제공하는 채널의 관점에서 관련 주제 도출
          • ex)고객 Call 대기 시간 최소화, 영업점 위치 최적화 등 
        • 규제와 감사 (Regulation & Audit) : 제품 생산 및 전달 과정 프로세스 중에서 발생하는 규제 및 보안의 관점에서 주제 도출
          • ex) 제공 서비스 품질의 이상 징후 관리, 새로운 환경 규제 시 예상되는 제품 추출 등 
        • 지원 인프라 (IT & Human Resource) : 분석을 수행하는 시스템 영역 및 이를 운영, 관리하는 인력의 관점에서 주제 도출
          • ex) EDW 최적화, 적정 운영 인력 도출 등 
        • 분석 기회 발굴의 범위 확장 
          • (1) 메가트렌드 : 사회,기술,경제,환경,정치 영역으로 나누어서 좀 더 폭넓기 기회 탐색을 수행(STEEP) 
          • (2) 경쟁사의 동향 : 현재 수행 사업 영역의 직접 경쟁사 및 제품,서비스 뿐만 아니라 대체제와 신규 진입자 등으로 관점을 확대하여 위험이 될 수 있는 상황에 대한 분석 기회 발굴의 폭을 넓혀서 탐색 
          • (3) 고객 (시장) 니즈의 변화 : 직접 고객 및 채널, 고객의 구매와 의사결정에 영향을 미치는 영향자들에 대한 폭넓은 관점을 바탕으로 분석 기회를 탐색 
          • (4) 역량의 변화 (재해석) : 현재 해당 조직 및 기업 역량 뿐만 아니라 해당 조직의 비즈니스에 영향을 끼치는 파트너 네트워크를 포함한 활용 가능 역량을 토대로 폭넓은 분석 기회를 탐색 

      • 2) 외부 참조 모델 기반 문제 탐색 
        • 유사, 동종 사례 벤치마킹을 통한 분석기회 발굴은 제공되는 산업별, 업무 서비스별 분석테마 후보 그룹을 통해 Quick & Easy 방식으로 필요한 분석 기회가 무엇인지에 대한 아이디어를 얻고 기업에 적용할 분석테마 후보 목록을 워크숍 형태의 브레인스토밍을 통해 빠르게 도출하는 방법이다.
      • 3) 분석 유즈 케이스 (Analytics Use Case) 정의 
        • 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 
          향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용하도록 한다. 
    • 나. 문제 정의 (Problem Definition) 단계 
      • 특정 문제 수행을 달성하기 위해 필요한 데이터 및 기법 (How)를 정의하기 위한 데이터 분석의 문제로의 변환 수행
      • "고객 이탈의 증대" 라는 비즈니스 문제는 "고객 이탈에 영향을 미치는 요인을 식별, 이탈 가능성을 예측"하는 분석 문제로 변환 될 수 있음
    • 다. 해결방안 탐색 (Solution Search) 단계 
      • 동일 데이터라도 어떤 시스템을 활용할 것인지에 따라 소요되는 예산 및 도구가 달라짐 
      • 기존 시스템 개선, 교육 및 채용을 통한 역량 확보, 시스템 고도화, 전문업체 소싱 등 
    • 라. 타당성 검토 (Feasibility Study) 단계 
      • (1) 경제적 타당성 
      • (2) 데이터 및 기술적 타당성 

     

    2. 상향식 접근법 (Bottom Up Approach)

    • 1) 기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론 
      • 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 문제를 도출하는 일련의 과정 
      • 새로운 문제 탐색에는 하향식 접근법이 맞지 않음 
      • 스탠포드 대학의 d.school은 디자인 사고 접근법을 통한 분석 방법 제시 
      • 이미 우리가 알고 있는 것, 즉 분석가의 문제에 대한 분석 접근법의 한계를 극복하기 위해 현장 관찰과 감정이입, 즉 대상의 관점으로부터의 전환을 수행 
    • 2) 지도 학습 / 비지도 학습
      • 일반적으로 상향식 접근 방식의 데이터 분석은 비지도 학습 (Unsupervised Learning)방법에 의해 수행된다. 
      • 비지도 학습은 데이터 분석의 목적이 명확히 정의된 형태의 특정 필드의 값을 구하는 것이 아니라 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현하는 것이다.
      • 이와 반대로 명확한 목적하에 데이터분석을 실시하는 것은 지도 학습 (Supervised Learning)이라고하며 분류, 추측, 예측, 최적화를 통해 사용자의 주도 하에 분석을 실시하고 새로운 데이터를 예측하는 것이다.
    • 프로토타이핑의 필요성 
      • (1) 문제에 대한 인식 수준 : 문제 정의가 불명확하거나 새로운 문제일 경우 프로토타아이핑으로 이해 및 구체화에 도움 받을 수 있음 
      • (2) 필요 데이터 존재 여부의 불확실성 : 불가능한 프로젝트를 수행하는 리스크 사전 방지 
      • (3) 데이터의 사용 목적의 가변성 : 데이터의 사용 목적과 범위 확대 가능 
    • 3. 분석과제 정의
      • 다양한 방식을 통해서 도출한 분석과제를 분석과제 정의서 양식을 활용하여 보다 상세하게 정의 
      • 분석과제 정의서를 통해 분석별로 필요한 소스 데이터, 분석방법, 데이터 입수 및 분석의 난이도, 분석수행 주기, 분석결과에 대한 검증 오너십, 상세 분석 과정 등을 정의 
      • 분석 데이터 소스는 내,외부의 비구조적인 데이터와 소셜 미디어 및 오픈 데이터까지 범위를 확장하여 고려하고 분석방법 또한 상세하게 작성한다 

      • 분석 프로젝트 관리 방안
        • 분석 과제의 주요 5가지 특성 및 주요 관리 영역
          • 1) Data Size : 분석하고자 하는 데이터의 양을 고려한 관리 방안 수립이 필요 
          • 2) Data Complexity : 초기 데이터의 확보와 통합 뿐 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요. 정형/비정형 등의 차이 등 
          • 3) Speed : 분석 결과가 도출되었을 때 이를 활용하는 시나리오 측면에서의 속도를 고려해야 한다. 
            일단위, 주단위 실적은 배치 형태로 작업해도 무방하나, 실시간으로 사기(Fraud)를 탐지하거나 고객에게 개인화된 상품, 서비스를 추천하는 경우에는 분석 모델의 적용 및 계산이 실시간으로 수행되어야 함 
          • 4) Analytic Complexity : 분석 모델의 정확도와 복잡도는 트레이드 오프 관계가 존재함. 
            이에 대한 기준점을 사전에 정의해 두어야 한다. 
          • 5) Accuracy & Precision
            • Accuracy는 모델과 실제 값 차이가 적다는 정확도를 의미함. 분석의 활용적인 측면에서 중요
            • Precision은 모델을 지속적으로 반복했을때의 편차의 수준으로써 일관적으로 동일한 결과를 제시한다는 것을 의미함. 분석의 안정성 측면에서 중요
            • 서로 간의 트레이드 오프 관계이므로 모델의 해석 및 적용시 사전에 고려해야함

    1. 분석 프로젝트의 특성

    • 데이터 영역과 비즈니스 영역에 대한 이해뿐만 아니라 지속적인 반복이 요구되는 분석 프로세스의 특성을 이해한 프로젝트 관리방안을 수립하는 것이 중요함
    • 분석과제 정의서를 기반으로 프로젝트를 시작하되 지속적인 개선 및 변경을 염두에 두고 기간 내에 가능한 최선의 결과를 도출할 수 있도록 프로젝트 구성원들과 협업하는 것이 특징임 

     

    2. 분석 프로젝트 관리 방안

    • 프로젝트 관리 지침 가이드
      • 통합 : 프로젝트와 관련된 다양한 활동과 프로세스를 도출, 정의, 결합, 단일화, 조정, 통제, 종료에 필요한 프로세스 
      • 이해관계자 : 프로젝트 스폰서, 고객사, 기타 이해관계자를 식별하고 관리하는데 필요한 프로세스
      • 범위 : 작업과 인도물을 식별하고 정의하는데 요구되는 프로세스
      • 자원 : 인력, 시설, 장비, 자재, 기반 시설, 도구와 같은 적절한 프로젝트 자원을 식별하고 확보하는데 필요한 프로세스
      • 시간 : 프로젝트 활동의 일정을 수립하고 일정 통제의 진척상황을 관찰하는데 요구되는 프로세스
      • 원가 : 예산 개발과 원가통제의 진척상황을 관찰하는데 요구되는 프로세스를 포함
      • 리스크 : 위험과 기회를 식별하고 관리하는 프로세스
      • 품질 : 품질보증과 품질통제를 계획하고확립하는데 요구되는 프로세스
      • 조달 : 계획에 요구된 프로세스를 포함하며 제품 및 서비스 또는 인도물을 인수하고 공급자와의 관계를 관리하는데 요구되는 프로세스
      • 의사소통 : 프로젝트와 관련된 정보를 계획, 관리, 배포하는데 요구되는 프로세스

    [분석 마스터 플랜]

    1. 분석 마스터 플랜 수립 프레임워크

    • 중/장기적 관점의 마스터 플랜 수립을 위해서는 분석 과제를 대상으로 전략적 중요도, 비즈니스 성과 및 ROI, 분석 과제의 실행 용이성 등 다양한 기준을 고려해 적용할 우선순위를 설정할 필요가 있다. 
    • 분석 과제의 우선순위뿐 아니라 분석의 적용 범위 및 방식에 대해서도 종합적으로 고려하여 데이터 분석을 실행하기 위한 로드맵을 수립한다.

    • 분석 마스터 플랜 수립 개요

     

    2. 수행 과제 도출 및 우선순위 평가

    • 우선순위 평가는 정의된 데이터 과제에 대한 실행 순서를 정하는 것이다  
    • ROI 관점으로 살펴본 빅데이터의 4V
      • 크기 (Volume)
      • 다양성 (Variety)
      • 속도 (Velocity)
      • 가치 (Value)
    • ROI 관점에서 우선순위 평가 기준
      • 시급성의 판단 기준은 전략적 중요도가 핵심이며, 이는 현재의 관점에 전략적 가치를 둘 것인지 미래의 중/장기적 관점에 전략전인 가치를 둘 것인지에 적정 시기를 고려하여 시급성 여부를 판단할 수 있다.
      • 난이도는 현 시점에서 과제를 추진하는 것이 비용 측면과 범위 측면에서 바로 적용하기 쉬운 (Easy) 것인지 또는 어려운 (Difficult) 것인지에 대한 판단 기준이다.

     

     

    • 분석 과제 우선순위 선정 매트릭스 (포트폴리오 4분면 분석)
      • ① 전략적 중요도가 높아 경영에 미치는 영향이 크므로 현재 시급하게 추진이 필요함
        난이도가 높아 현재 수준에서 과제를 바로 적용하기에 어려움
      • ② 현재 시점에서는 전략적 중요도가 높지 않지만 중장기적 관점에서는 반드시 추진되어야 함
        분석과제를 바로 적용하기에는 난이도가 높음
      • ③ 전략적 중요도가 높아 현재 시점에 전략적 가치를 두고 있음
        과제 추진의 난이도가 어렵지 않아 우선적으로 바로 적용 가능함
      • ④ 전략적 중요도가 높지 않아 중장기적 관점에서 과제 추진이 바람직함
        과제를 바로 적용하는 것은 어렵지 않음

     

    • 이행 계획 수립
      • 로드맵 수립 
        • 단계별로 추진하고자 하는 목표를 명확히 정의하고 추진 과제별 선.후행 관계를 고려하여 단계별 추진 내용을 정렬한다.
      • 세부 이행계획 수립
        • 데이터 분석 체계는 고적적인 폭포수 (Waterfall) 방식도 있으나 반복적인 정련과정을 통하여 프로젝트의 완성도를 높이는 방식을 주로 사용한다.

     

    [분석 거버넌스 체계 수립]

    1. 거버넌스 체계 개요

    • 분석 거버넌스는 기업에서 데이터가 어떻게 관리되고, 유지되고, 규제 되는지에 대한 내부적인 관리 방식이나 프로세스를 의미한다.
      • 거버넌스 (governance)
        • 국가경영, 공공경영이라고 해석이 되며, 행정까지도 포함하는 용어
        • 기업에서는 경영목표를 충족시킬 수 있는 계획을 개발하고 통제하는 프로세스를 의미

     

    2. 데이터 분석 수준 진단

    • 1) 분석 준비도
      • 분석 준비도 프레임워크
        • ⓐ 분석업무파악: 발생한 사실 분석 업무, 예측/시뮬레이션/최적화 분석 업무, 분석 업무 정기 개선
        • ⓑ 인력 및 조직: 분석 전문가 직무 존재, 분석 전문가 교육 훈련 프로그램, 관리자들의 기본적 분석 능력, 전사 분석업무 총괄 조직 존재, 경영진의 분석 업무 이해 능력
        • ⓒ 분석 기법: 업무별 적합한 분석기법 사용, 분석 업무 도입 방법론, 분석기법 라이브러리/효과성 평가/정기적 개선
        • ⓓ 분석 데이터 : 데이터 충분성/신뢰성/적시성, 비구조적 데이터 관리, 외부 데이터 활용 체계, 기준 데이터 관리(MDM)
        • ⓔ 분석 문화 : 사실에 근거한 의사결정, 관리자의 데이터 중시, 데이터 활용, 경영진의 직관보다 데이터, 데이터 공유 및 협업 문화
        • ⓕ IT인프라 : 운영시스템 데이터 통합, 데이터 유통체계, 분석 전용 서버 및 스토리지, 빅데이터 분석 환경, 통계 분석 환경, 비쥬얼 분석 환경

    3. 분석 성숙도 모델

    • CMMI (Capability Maturity Model Integration) 모델
      • 시스템 개발 업무 능력과 조직의 성숙도를 파악하기 위해 사용하는 모델
    단계 도입 활용 확산  최적화
    설명 분석을 시작하여 환경과 시스템을 구축 분석 결과를 실제 업무에 적용 전사 차원에서 분석을 관리하고 공유 분석을 진화시켜서 혁신 및 성과 향상에 기여
    비즈니스
    부문
    실적분석 및 통계
    미래결과 예측/시뮬레이션 전사 성과 실시간 분석/분석규칙 관리 외부환경 분석/ 최적화 업무 적용/ 실시간 분석
    조직역량 담당자 역량 의존 전문 부서 수행 모든 부서 수행 데이터 사이언스 그룹
    IT 부문 데이터 웨어하우스 실시간 대시보드 비주얼 분석 분석 협업환경


    4. 분석 수준 진단 결과

    • ⓐ 정착형 : 준비도는 낮으나 조직/인력/분석업무/분석기법 등을 기업 내부에서 제한적으로 사용하고 있어 1차적으로 정착이 필요한 기업
    • ⓑ 확산형 : 기업에 필요한 6가지 분석 구성요소를 갖추고 있고, 현재 부분적으로 도입되어 지속적인 확산이 필요한 기업
    • ⓒ 준비형 : 기업에 필요한 데이터/인력/조직/분석업무/분석기법 등이 적용되지 않아 사전 준비가 필요한 기업
    • ⓓ 도입형 : 기업에서 활용하는 분석업무/기법 등은 부족하지만 적용 조직 등 준비도가 높아 바로 도입할 수 있는 기업


    5. 분석 지원 인프라 방안 수립

    • 분석 과제 단위별로 별도의 분석 시스템을 구축하는 경우, 관리의 복잡도 및 비용의 증대라는 부작용이 나타나게 된다. 
    • 따라서 분석 마스터 플랜을 기획하는 단계에서부터 장기적으로 안정적으로 활용할 수 있는 확장성을 고려한 플랫폼 구조를 도입하는 것이 적절하다.


    6. 데이터 거버넌스 체계 수립

    • 빅데이터는 데이터의 크기 (Volume)로 그 의미의 절대성을 갖는 것은 아니다.
    • 그러나 실시간으로 쏟아지는 엄청난 양의 데이터와 정형화된 데이터를 넘어 비정형/반정형의 데이터는 조직이나 프로젝트 단위의 데이터 관리체계로는 그 해답을 찾을 수 없음
    • 전사 차원의 체계적인 데이터 거버넌스 (Data Governace)의 필요성을 부각시키고 있음
    • 데이터 거버넌스의 중요한 관리대상
      • 마스터 데이터 (Master Data)
      • 메타 데이터 (Meta Data)
      • 데이터 사전 (Data Dictionary)
    • 데이터 거버넌스의 구성요소
      • 원칙 (Principle) : 데이터를 유지 관리하기 위한 지침과 가이드
      • 조직 (Organization) : 데이터를 관리할 조직의 역할과 책임
      • 프로세스 (Process) : 데이터 관리를 위한 활동과 체계
    • 데이터 거버넌스 체계 요소
      • 데이터 표준화 : 명명규칙수립, 메타데이터 구축, 데이터사전 구축
      • 데이터 관리 체계 : 메타데이터와 데이터 사전의 관리 원칙을 수립
      • 데이터 저장소관리 (Repository)
      • 표준화 활동

    7. 데이터 조직 및 인력방안 수립

    • 빅데이터의 등장에 따라 기업의 비즈니스도 많은 변화를 겪고 있다. 
    • 이러한 비즈니스 변화를 인식하고 기업의 차별된 경쟁력을 확보하는 수단으로 데이터 과제 발굴, 기술 검토 및 전사 업무 적용 계획 수립 등 데이터를 효과적으로 분석
    • 또한 활용하기 위해 기획, 운영 및 관리를 전담할 수 있는 전문 분석 조직의 필요성이 제기되고 있다.

    • 데이터 분석을 위한 3가지 조직 구조
      • ⓐ 집중구조
        • 전사 분석업무를 별도의 분석전담 조직에서 담당
        • 전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행가능
        • 현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
      • ⓑ 기능구조
        • 일반적인 분석 수행 구조
        • 별도의 분석조직이 없고 해당 업무 부서에서 분석 수행
        • 전사적 핵심분석이 어려우며, 부서 현황 및 실적 통계 등 과거실적에 국한된 분석 수행 가능성 높음
      • ⓒ 분산구조
        • 분석조직 인력들은 현업부서로 직접 배치하여 분석업무 수행
        • 전사차원의 우선순위 수행
        • 분석결과에 따른 신속한 Action 가능
        • 베스트 practice 공유 가능
        • 부서 분석업무와 역할 분담이 명확해야 함

    • 분석조직 인력구성의 예
      • ⓐ 비지니스 인력 : 해당 비지니스를 잘 이해하고 분석 요소를 찾고 협의 할 수 있는 인력
      • ⓑ IT기술 인력 : 분석에 필요한 IT기술동향을 파악하고 필요한 기술 아키텍처를 수립할 수 있는 인력
      • ⓒ 분석전문 인력 : 고급 통계 분석 기법을 이해하고 다양한 예측 모델링을 설계/검증할 수 있는 인력
      • ⓓ 변화관리 인력 : 경영층 대상으로 분석문화 확산을 위한 변화관리를 담당하는 인력
      • ⓔ 교육담당 인력 : 분석조직에게 다양한 분석기법에 대한 심도있는 교육을 할 수 있는 인력
      • 변화관리 인력, 교육담당 인력은 겸직 가능

    8. 분석 과제 관리 프로세스 수립

    • 분석 과제 관리 프로세스는 크게 과제 발굴과 과제 수행 및 모니터링으로 나누어진다. 
    • 과제 발굴 단계 : 개별 조직이나 개인이 도출한 분석 아이디어를 발굴하고 이를 과제화하여 분석 과제 풀 (Pool)로 관리하면서 분석 프로젝트를 선정하는 작업을 수행한다. 
    • 과제 수행 단계 : 분석을 수행할 팀을 구성하고 분석 과제 실행 시 지속적인 모니터링과 과제 결과를 공유하고 개선하는 절차를 수행한다.

    9. 분석 교육 및 변화관리

    • 기업에 맞는 적합한 분석 업무를 도출하고 가치를 높혀 줄 수 있도록 분석 조직 및 인력에 대한 지속적인 교육과 훈련을 실시해야 함.
    • 경영층이 사실 기반 의사결정을 할 수 있도록 문화를 정착시키는 등 지속적인 변화관리를 계획하고 수행해야 함

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기