정보

    • 업무명     : 데이터분석 준전문가 (ADsP) Ⅱ 데이터 분석 기획 : 01~17강
    • 작성자     : 이상호
    • 작성일     : 2024.06.15
    • 설   명      :
    • 수정이력 :

     

     01강Ⅱ-1-1 데이터 분석의 계획 수립 방향성

    (1) 분석기획이란?

    • 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업
      • (문제 정의) 분석하고자 하는 문제나 질문을 명확히 정의함
      • (목표 설정) 분석 결과를 통해 달성하고자 하는 주요 목표임
      • (자원 파악) 필요한 데이터 출처를 파악하고, 분석에 사용될 도구와 기술을 결정함. 또한 프로젝트를 수행할 인력의 역량도 고려함
      • (계획 수립) 데이터 수집, 데이터 정제, 모델링, 분석, 결과 검토 및 보고 등의 단계가 포함함
      • (시간 관리 및 일정 수립) 프로젝트를 효율적으로 관리하고, 시간 내에 목표를 달성하기 위해  각 단계마다 시작일/종료일 설정
      • (위험 관리) 잠재적인 위험 목록을 사전에 식별하고, 이에 대한 대비함

     

    (2) 분석 대상과 방법

    • 분석은 분석의 대상(What)과 분석의 방법(How)에 따라서 4가지로 나누어진다.
      • (최적화) 주어진 매개변수와 제약 조건 내에서 최고의 결과를 달성하기 위해 알려진 방법을 적용
      • (통찰) 알려진 분석 방법을 사용하여 이해되지 않은 현상이나 데이터에서 숨겨진 패턴을 발견하는 과정
      • (해법) 알려진 문제에 대해 새로운 해결 방법을 찾는 과정
      • (발견) 알려지지 않은 문제를 새롭고 알려지지 않은 방법으로 탐색

     

    (3) 목표 시점별 분석 기획 방안

    • ①과제 중심적인 접근방식 : 목표시점 별로 당면한 과제를 빠르게 해결하는 방식 (단기 목표)
    • ②장기적인 마스터 플랜 방식 : 지속적인 분석 내재화를 위한 방식 (장기 목표)
      • 의미있는 분석을 위해 분석기술, IT 및 프로그래밍, 분석 주제에 대한 도메인 전문성, 의사소통이 중요
      • 분석 대상 및 방식에 따른 다양한 분석 주제를 과제 단위 혹은 마스터플랜 단위로 도출

     

    (4) 분석 기획시 고려사항

    • ① 가용 데이터에 대한 고려
      • 분석을 위한 데이적용 가능한 솔루션, 분석 방법을 위한 유형터의 확보가 우선적
      • 유형에 따라 에 대한 분석
    • ② 분석을 통해 가치가 창출될 수 있는 적절한 활용방안과 유즈 케이스 탐색
      • (유즈케이스) 소프트웨어나 시스템이 사용자(또는 다른 시스템)의 요구를 충족하기 위해 수행하는 기능 명세임. 즉 시스템이 어떤 상황에서 어떻게 사용될 수 있는지를 구체적으로 설명함.
    • ③ 분석 수행시 발생하는 장애요소들에 대한 사전계획 수립
      • 데이터 품질 문제, 기술적 한계, 자원의 부족 등

     

    연습문제1

    분석은 분석의 대상(What)과 분석의 방법(How)에 따라서 4가지로 나누어진다. 그것에 해당하는 것이 아닌 것은?
    ① 최적화 (Optimization)
    ② 해법 (Solution)
    ③ 통찰(Insight)
    ④ 발명(invention)

     

    연습문제2

    목표 시점별 분석 기획 방안중 장기적인 마스터 플랜 방식에 해당하는 내용이 아닌 것은?
    ①목표시점 별로 당면한 과제를 빠르게 해결하는 방식
    ②지속적인 분석 내재화를 위한 방식
    ③의미있는 분석을 위해 분석기술, IT 및 프로그래밍, 분석 주제에 대한 도메인 전문성, 의사소통이 중요
    ④분석 대상 및 방식에 따른 다양한 분석 주제를 과제 단위 혹은 마스터플랜 단위로 도출

     

     02강Ⅱ-1-2 분석 방법론

    (1) 분석 방법론 개요

    • ① 개요
      • 데이터 분석이 효과적으로 기업내에 정착하기 위해서는 이를 체계화한 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수적
      • 방법론은 상세한 절차(Procedures), 방법(Methods), 도구와 기법(Tool&Techniques), 템플릿과 산출물(Templates&Outputs)로 구성되어 어느 정도의 지식만 있으면 활용이 가능
        • (상세한 절차 Procedures) 목표 설정에서부터 데이터 수집, 분석, 결과 해석, 보고서 작성에 이르기까지의 전 과정을 포함
        • (방법 Methods) 데이터 수집에서 특정 샘플링 기법을 사용, 분석 과정에서 통계 모델이나 알고리즘을 적용 방안 등
        • (도구와 기법 Tools & Techniques) 데이터 분석에 필요한 소프트웨어 도구, 프로그래밍 언어 (R, Python 등), 기술적 기법 등을 포함
        • (템플릿과 산출물 Templates & Outputs) 분석 과정에서 생성되는 문서나 보고서의 포맷을 표준화 제공

     

    • ② 데이터 기반 의사결정의 필요성
      • 경험과 감에 따른 의사결정 > 데이터 기반의 의사결정
      • 합리적 의사결정을 가로막는 장애요소
        • 고정관념
        • 편향된 생
        • 프레이밍 효과(문제의 표현 방식에 따라 동일한 사건이나 상황임에도 불구하고 개인의 판단이나 선택이 달라지는 현상) 등

     

    • ③ 방법론의 생성과정
      • 암묵지: 학습과 경험을 통해 개인에게 내재되어 있지만 겉으로 드러나지 않는 지식
        • 예제) 김치담그기, 자전거 타기

      • 형식지: 문서나 매뉴얼처럼 형상화된 지식
        • 예제) 교과서, 비디오, DB
        • 즉 지식 생성의 사이클을 구성하여 방법론이 단순한 지침서에 그치지 않고, 실제 작업 환경에서 유용하고 효과적인 도구 활용

     

    • ④ 방법론의 적용 업무의 특성에 따른 모델
      • (ⅰ) 폭포수 모델(Waterfall Model)
        • 단계를 순차적으로 진행하는 방법이다.
      • (ⅱ) 프로토타입 모델(Prototype Model)
        • 폭포수 모델을 보완한 모델로서 점진적으로 시스템을 개발해 나가는 접근 방식이다.
        • 고객의 요구를 완전하게 이해하고 있지 못하거나 완벽한 요구 분석의 어려움을 해결하기 위해 일부분을 우선 개발하여 사용자에게 제공.
      • (ⅲ) 나선형 모델(Spiral Model)
        • 반복을 통해 점증적으로 개발하는 방법으로, 처음 시도하는 프로젝트에 적용이 용이하지만 관리체계를 효과적으로 갖추지 못한 경우 복잡도가 상승하여 프로젝트 진행이 어려울 수 있다.

     

    • ⑤ 방법론의 구성
    구분 설명
    단계 최상위 계층으로서 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성
    태스크 단계를 구성하는 단위 활동으로서 물리적 또는 논리적 단위로 품질검토의 항목
    스텝 입력자료(input), 처리 및 도구, 출력자료(output)로 구성된 단위 프로세스

     

    [15회 기출]

    다음 분석 방법론 중 순차적으로 진행되면서 이전 단계가 완료된 후 다음 단계로 진행하는 하향식(Top Down)으로 진행되는 특징을 가지고 있는 모델은?
    ①프로토타입(Prototype) 모델
    ②폭포수(Waterfall) 모델
    ③나선형(Spiral) 모델
    ④애자일(Agile) 모델

     

    [18회 기출]

    분석 기획 고려사항 중 장애요소에 대한 설명으로 부적절한 것은?
    ① 비용대비 효과의 적정한 비용
    ② 분석 모형의 안정적 성능 확보
    ③ 이해도 높은 모형보다는 복잡하고 정교한 모형
    ④ 조직 역량으로 내재화를 위한 변화 관리

     

     03강Ⅱ-1-2 분석 방법론2

    (2) KDD 분석 방법론

    • ① 개요
      • 기업들은 매월/매년마다 주기적으로 분석하며 이때 새롭게 분석 기획을 하는 것이 비효율적임
      • 따라서 분석 작업의 효율성을 높이고 일관성을 유지하는 체계화된 분석 방법론의 도입이 필요함
      • KDD(Knowledge Discovery in Database)는 1996년 프로파일링 기술을 기반으로 데이터로부터 통계적 패턴이나 지식을 찾기 위해 체계적으로 정리한 데이터 마이닝 프로세스이다.

     

    ② 분석절차

    데이터셋 선택 데이터 전처리/준비 데이터 변환 데이터마이닝 결과 평가
    데이터베이스 또는 원시 데이터에서 분석에 필요한 데이터 선택하는 단계


    목표데이터를 구성하여 분석에 활용
      데이터 셋에 포함되어 있는 잡음, 이상치, 결측치를 식별


    필요시 제거하여 의미있는 데이터로 재처리하여 데이터 셋을 정제하는 단계이다.
      데이터의 원본을 축소하여 효율적으로 데이터마이닝을 할 수 있도록 데이터 변경


    데이터마이닝 프로세스를 진행하기 위해 학습용 데이터 (training data)와 검증용 데이터 (test data)를 분리
       
    데이터마이닝 기법을 선택하고 적절한 알고리즘을 적용하여 데이터 마이닝 작업을 실행하는 단계이다.


    데이터 전처리와 변환 프로세스를 추가로 실행하여 최적의 결과를 산출
      데이터마이닝 결과에 대한 해석과 평가 분석 목적과의 일치성

     

    (2) KDD 분석 방법론

    • <참조> KDD, 데이터 마이닝
      • 데이터 마이닝(data mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아 내는 것이다. 
      • 다른 말로는 KDD(데이터베이스 속의 지식 발견, knowledge-discovery in databases)라고도 일컫는다.
      • (1) 개요
        • 데이터 마이닝은 통계학에서 패턴 인식에 이르는 다양한 계량 기법을 사용한다. 데이터 마이닝 기법은 통계학쪽에서 발전한 탐색적자료분석, 가설 검정, 다변량 분석, 시계열 분석, 일반선형모형 등의 방법론과 데이터베이스 쪽에서 발전한 OLAP (온라인 분석 처리:On-Line Analytic Processing), 인공지능 진영에서 발전한  SOM, 신경망, 전문가 시스템 등의 기술적인 방법론이 쓰인다. 
        • 데이터 마이닝의 응용 분야로 신용평점 시스템(Credit Scoring System)의 신용평가모형 개발, 사기탐지시스템(Fraud Detection System), 장바구니 분석(Market Basket Analysis), 최적 포트폴리오 구축과 같이 다양한산업 분야에서 광범위하게 사용되고 있다. 
          단점으로는, 자료에 의존하여 현상을 해석하고 개선하려고 하기 때문에 자료가 현실을 충분히 반영하지 못한 상태에서 정보를 추출한 모형을 개발할 경우 잘못된 모형을 구축하는 오류를 범할 수가 있다.
      • (2) 적용 분야
        • 데이터마이닝은 데이터 분석을 통해 아래와 같은 분야에 적용하여 결과를 도출할 수 있다. 
        • 분류(Classification): 일정한 집단에 대한 특정 정의를 통해 분류 및 구분을 추론한다 (예: 경쟁자에게로 이탈한 고객)
        • 군집화(Clustering): 구체적인 특성을 공유하는 군집을 찾는다. 군집화는 미리 정의된 특성에 대한 정보를 가지지 않는다는 점에서 분류와 다르다 (예 : 유사 행동 집단의 구분)
        • 연관성(Association): 동시에 발생한 사건간의 관계를 정의한다. (예: 장바구니안의 동시에 들어 가는 상품들의 관계 규명)
        • 연속성(Sequencing): 특정 기간에 걸쳐 발생하는 관계를 규명한다. 기간의 특성을 제외하면 연관성 분석과 유사하다 (예: 슈퍼마켓과 금융상품 사용에 대한 반복 방문)
        • 예측(Forecasting): 대용량 데이터집합 내의 패턴을 기반으로 미래를 예측한다 (예: 수요예측)

     

    연습문제1

    대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아 내는 것을 일컫는 말은?
    ①데이터 마이닝
    ②기계학습   
    ③지도학습 
    ④준지도학습

    연습문제2

    데이터마이닝은 데이터 분석을 통해 일정한 집단에 대한 특정 정의를 통해 분류 및 구분을 추론하는 결과를 도출할 수 있다. 무엇에 관한 설명인가?
    ①분류(Classification)
    ②군집화(Clustering)
    ③연관성(Association)
    ④연속성(Sequencing)

     

     04강Ⅱ-1-2 분석 방법론3

    (3) CRISP-DM 분석 방법론

    • ① 개요
      • CRISP-DM(Cross Industry Standard Process for Data Mining)은 데이터 마이닝에 사용되는 일반적인 접근 방식 설명하는 열린 표준 과정 모델이다. 가장 널리 사용되는 분석 모델이다. 
      • CRISP-DM은 1996년 유럽연합의 ESPRIT에서 있었던 프로젝트에서 시작되었으며, 계층적 프로세스 모델로서 4개의 레벨로 구성된다.

     

    • ② CRISP-DM 4레벨 구조
    단계 (Phases) 최상위 레벨은 여러 개의 단계(Phases)로 구성
    일반 과제 (Generic Tasks) 데이터마이닝의 단일 프로세스를 완전하게 수행하는 단위
    세부 과제 (Specialized Tasks) 일반 과제를 다시 구체적인 수행 레벨은 세분화 태스크로 구성
    프로세스 실행 (Process Instances) 데이터마이닝을 위한 구체적인 실행을 포함

     

    • ③ 분석절차
      • 6단계 반복 수행
    단계 업무 이해 데이터 이해 데이터 준비 모델링 평가 전개
    내용 도메인 지식을 데이터 분석을 위한 문제정의를 변경하고 초기 프로젝트 계획을 수립하는 단계 분석을 위한 데이터를 수집하고 속성을 이해하기 위한 단계 분석을 위하여 수집된 데이터에서 분석기법에 적합한 데이터를 편성하는 단계 모델링 기법과 알고리즘을 선택하고 모델링 과정에서 사용되는 파라미터를 최적화해 나가는 단계 프로젝트 목적에 부합하는지 평가하는 단계로 데이터마이닝 결과를 최종적으로 수용할것인지 판단 모델링과 평가 단계를 통하여 완성된 모델을 실 업무에 적용하기 위한 계획을 수립하는 단계
    수행
    업무
    업무목적파악, 데이터마이닝 목표 설정,
    프로젝트 계획수립
    초기 데이터 수집, 데이터 기술분석, 탐색, 풀질확인 분석용 데이터셋선택,
    데이터 정제
    모델링 기법선택, 모델 테스트 계획 설계, 모델작성, 모델평가 분석결과평가, 모델링과정평가, 적용성 평가 전개 계획 수립,
    모니터링과유지보수 계획 수립

     

     

    연습문제1

    다음 중 CRISP-DM 방법론의 모델링 단계에서 수행하는 테스크(task)로 적절하지 않은 것은 무엇인가?
    ①모델 테스트 계획 설계
    ②모델 평가
    ③모델링 기법 선택
    ④모델 적용성 평가

     

    연습문제2

    CRISP-DM 4레벨 구조중 데이터마이닝의 단일 프로세스를 완전하게 수행하는 단위에 해당하는 것은?
    ①단계
    ②일반 과제
    ③세부 과제
    ④프로세스 실행

     

     05강Ⅱ-1-2 분석 방법론4

    (4) 빅데이터 분석 방법론

    • ① 3단계 프로세스
    구분 설명
    단계 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성된다.
    각 단계는 기준선으로 설정되어 관리되어야 하며, 버전관리 등을 통하여 통제가 이루어져야 한다.
    과제 (태스크) 단계를 구성하는 단위 활동으로서 물리적 또는 논리적 단위로 품질검토의 항목
    스텝 입력자료(input), 처리 및 도구, 출력자료(output)로 구성된 단위 프로세스

     

    • ② 분석 방법론
    분석기획
    (Planning)
    데이터준비
    (Preparing)
    데이터분석
    (Analyzing)
    시스템구현
    (Developing)
    평가 및 전개
    (Deploying)
    ∙비즈니스 이해  및 범위 설정
    ∙프로젝트 정의 및 계획 수립
    ∙프로젝트 위험 계획 수립
    ∙필요데이터 정의
    ∙데이터 스토어 설계
    ∙데이터 수집 및 적합성 점검
    ∙분석용 데이터 준비
    ∙텍스트 분석
    ∙탐색적 분석
    ∙모델링
    ∙모델 평가 및  검증
    ∙모델 적용 및 운영방안 수립
    ∙설계 및 구현
    ∙시스템테스트 및 운영
    ∙모델 발전 계획 수립
    ∙프로젝트 평가 및 보고

     

     

    (4) 빅데이터 분석 방법론

    • ③ 분석기법
      • 상기 특징을 가진 빅데이터의 분석, 활용을 위한 빅데이터 처리 기법은 크게 분석 기술, 표현 기술로 나뉜다. 
      • 분석 기술
        • 빅데이터를 다루는 처리 프로세스로서 병렬 처리의 핵심은 분할 점령(Divide and Conquer)이다. 즉 데이터를 독립된 형태로 나누고 이를 병렬적으로 처리하는 것을 말한다.
        • 빅데이터의 데이터 처리란 이렇게 문제를 여러 개의 작은 연산으로 나누고 이를 취합하여 하나의 결과로 만드는 것을 뜻한다. 대용량의 데이터를 처리하는 기술 중 가장 널리 알려진 것은 아파치 하둡과 같은 Map-Reduce 방식의 분산 데이터 처리 프레임워크이다. 
        • 대부분의 빅 데이터 분석 기술과 방법들은 기존 통계학과 전산학에서 사용되던 데이터마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 해당한다. 소셜 미디어등 비정형 데이터의 증가로 인해 분석기법 중에서 텍스트 마이닝, 오피니언 마이닝, 소셜네트워크 분석, 군집분석 등이 주목받고 있다.
        • 아파치 하둡(Apache Hadoop) : 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크
        • 텍스트 마이닝: 비/반정형 텍스트 데이터에서 자연 언어 처리 기술에 기반을 두어 유용한 정보를 추출, 가공
        • 오피니언 마이닝: 소셜미디어 등의 정형/비정형 텍스트의 긍정, 부정, 중립의 선호도를 판별
        • 소셜 네트워크 분석: 소셜 네트워크의 연결 구조 및 강도 등을 바탕으로 사용자의 명성 및 영향력을 측정
        • 군집 분석: 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 군집을 발굴
        • 대규모의 정형/비정형 데이터를 처리하는 데 있어 가장 기본적인 분석 인프라로 하둡이 있으며 데이터를 유연하고 더욱 빠르게 처리하기 위해 NoSQL 기술이 활용되기도 한다.
      • 표현 기술
        • 빅데이터 분석 기술을 통해 분석된 데이터의 의미와 가치를 시각적으로 표현하기 위한 기술로 대표적인 것으로는 R (프로그래밍 언어), 파이선 등이 있다.

     

    연습문제1

    빅데이터 분석 방법론의 분석기획 단계 순서가 바르게 연결된 것은?
    ①프로젝트 범위설정-데이터분석 프로젝트정의-프로젝트 수행계획 수립-데이터분석 위험식별
    ②프로젝트 범위설정-데이터분석 프로젝트정의-데이터분석 위험식별-프로젝트 수행계획 수립
    ③데이터분석 위험식별-프로젝트 범위설정-프로젝트 수행계획 수립-데이터분석 프로젝트정의
    ④데이터분석 위험식별-프로젝트 범위설정-데이터분석 프로젝트정의-프로젝트 수행계획 수립

    연습문제2

    소셜 미디어등 비정형 데이터의 증가로 인해 다양한 빅데이터 분석방법이 주목받고 있다. 이 부합하는 분석방법이 아닌 것은?
    ① 지도학습
    ② 오피니언 마이닝
    ③ 소셜네트워크 분석
    ④ 군집분석

     

     06강Ⅱ-1-3 분석 과제 발굴

    (1) 분석 과제 발굴 방법론

    • ① 분석 과제 발굴 방법론이란?
      • 분석 과제는 하향식 접근 방법이나 상향식 접근 방법을 이용하여 풀어야 할 다양한 문제를 해결함
      • 이를 데이터 분석 문제로 전환하여 관계자들이 이해하고 프로젝트로 수행할 수 있는 형태로 도출하는 이론
      • (하향식 접근 방법) 분석대상을 알고 있음 
      • (상향식 접근 방법) 분석대상을 모르고 있음

     

     

     

    • ② 하향식 접근법(Top Down Approach)
      • (비즈니스 모델기반 문제탐색) 기업의 기존 비즈니스 모델을 깊이 분석하면서 문제의 원인을 찾아 해결
      • (외부사례 기반 문제탐색) 다른 기업이나 산업의 성공 사례를 분석하여 자신의 비즈니스 문제를 해결 
    1.문제 탐색
    (Problems Discovery)
    2.문제 정의
    (Problems Definition)
    3.해결방안탐색
    (Solution Search)
    4.타당성검토
    (Feasibility study)
    •비즈니스 모델기반 문제탐색
    •외부사례 기반 문제탐색(=벤치마킹)
    데이터 분석
    문제 변환
    수행 옵션 도출
    •타당성 평가
    •과제 선정

     

    • (ⅰ) 문제 탐색(Problem Discovery)
      • 전체적인 관점에서 빠짐없이 문제를 도출하고 식별하는 것이 중요하고, 
      • 과제 발굴 단계에서는 세부적인 구현 및 솔루션에 초점을 맞추는게 아니라, 문제를 해결함으로써 발생하는 가치에 중점을 두는 것이 중요하다.
      • 비즈니스 모델 기반 문제 탐색
        • 기업 내부, 외부 환경을 포괄하고 있는 비즈니스 모델이라는 틀을 활용하여 문제 탐색

     

     

    • 각 과제 발굴방법과 예시는 다음과 같습니다.
    과제 발굴 방법 업무
    (operation)
    제품
    (product)
    고객
    (customer)
    규제와 감사 지원 인프라
    내용 제품 및 서비스를 생산하기 위해서 운영하는 내부프로세스 및 주요 자원 관련 주제 도출 생산 및 제공하는 제품, 서비스를 개선하기 위한 관련 주제 도출 제품, 서비스를 제공하는 사용자 및 고객, 이를 제공하는 채널의 관점에서 관련 주제 도출 제품 생산 및 전달 과정 프로세스 중 발생하는 규제 및 보안의 관점에서 주제 도출 분석을 수행하는 시스템 영역 및 이를 운영 관리하는 인력의 관점에서 주제 도출
    생산 공정 최적화 제품의 주요기능 개선 영업점 위치 최적화 제공 서비스 품질의 이상 징후 관리 적정 운영 인력 도출

     

     

    • 외부사례 모델 기반 문제 탐색
      • 유사, 동종 사례 벤치마킹을 통한 분석 기회 발굴은 제공되는 산업별, 업무 서비스별 분석 테마 후보 그룹을 통해 필요한 분석 기회가 무엇인지에 대한 아이디어를 얻고, 기업에 적용할 분석 테마 후보 목록을 워크숍 형태의 브레인스토밍(Brain storming)을 통해 빠르게 도출하는 방법이다.

     

    • (ⅱ) 문제 정의(Problem Definition)
      • 식별된 비즈니스 문제를 데이터 분석 문제로 변환하여 정의하는 단계이다.
      • 다음과 같은 예시를 생각해볼 수 있다.
    비즈니스 문제 데이터 분석문제
    구매자 감소 구매자 감소에 미치는 요인을 찾고, 구매자 수 예측

     

    • (ⅲ) 해결방안탐색(Solution Search)
      • 정의된 데이터 분석 문제를 해결하기 위한 다양한 방안이 탐색
      • 기존 정보 시스템의 단순한 보완으로 분석이 가능한지 고려
      • 교육 및 채용을 통하여 역량확보
      • 전문업체를 통하여 과제해결

     

    • (ⅳ) 타당성 검토(Feasibility study)
      • 도출된 분석 문제나 가설에 대한 대안을 과제화하기 위해서는 다각적인 타당성 분석 수행
    타당성 내용
    경제적 타당성 비용대비 편익 분석관점 접근
    비용:데이터, 시스템, 인력, 유지보수
    편익:실질적 비용절감, 추가적 매출, 수익
    데이터 타당성 데이터의 존재여부, 분석 시스템 환경
    기술적 타당성 역량 확보 방안을 사전에 수립하고 효과적으로 평가

     

    연습문제1

    비즈니스 모델 캔버스의 채널에 대한 기능으로 가장 부적절한 것은?
    ① 해당고객에게 접근하는 유통 채널을 공급한다.
    ② 고객에게 밸류 프로포지션을 전달한다.
    ③ 구매 고객에 대한 에프터서비스(A/S)를 제공한다.
    ④ 기업이 제공하는 상품이나 서비스에 대한 고객의 이해를 높여준다.


    연습문제2

    비즈니스 모델 캔버스는 문제 탐색단계에서 사용하는 도구이다. 이를 구성하는 단위로 적절한 것은?
    ① 영업-고객-제도-업무-IT인프라
    ② 업무-제품-고객-규제와 감사-지원인프라
    ③ 프로세스-제품-고객-영업-IT인프라
    ④ 비용-수입-고객-상품-감사

     07강Ⅱ-1-3 분석 과제 발굴2

    (1) 분석 과제 발굴 방법론

    • ② 상향식 접근법(Bottom Down Approach)

     

    • (ⅰ) 개요
      • 다양한 원천 데이터를 대상으로 분석을 수행하여 모든 문제를 도출하는 일련의 과정이다.
      • 전통적인 하향식 방식에 대비하여 기업에서 보유하고 있는 다양한 데이터로부터의 분석을 통하여 통찰력과 지식을 얻는 방식이다.

     

    • (ⅱ) 하향식 VS 상향식
      • 기존 하향식 접근법은 문제의 구조가 분명하고 문제를 해결하고 해결책을 도출하기 위한 데이터 분석가 및 의사 결정자에게 주어져 있는 경우에 유용
      • 최근 복잡하고 다양한 환경에서 발생하는 문제의 경우 하향식 접근법의 한계성
      • 해결책으로 디자인사고(Design thinking) 접근법 고려

     

    • <참조> 디자인 사고(Design thinking)
    경영에 대한 두 관점
    분석적 사고
    (Analytical thinking)
      직관적 사고
    (intuitive thinking)
    영역적, 귀납적 추리로 무장한 엄밀한 분석과정을 통한 사고   분석에 기반을 두지 않고 순간적인 영감과 창조적인 직감을 중시하는 사고
     
    이미 시도되고 검증된 것을 철저하게 고집 대안 사업체계화 역량 부족으로 성장과 지속의 문제에 봉착
    디자인 사고
    (Design thinking)
      분석적 사고에 기반을 둔 완벽한 숙련과 직관적 사고에 근거한 창조성이 역동적으로 상호작용하면서 균형유지  

     

     

    (1) 디자인 사고의 요소

    • ①공감(Empathy): 관찰, 인터뷰, 감정이입을 통해서 사용자의 입장에서 공감하고 영감을 얻는 것이 중요하고, 나의 생각을 검증하는 것이 아니라 상대의 경험을 있는 그대로 받아들이는 것이 중요하다.
    • ②정의(Define): 새로운 컨셉을 디자인하는 것으로 현장 관촬을 통해 얻은 영감을 바탕으로 실제(real), 유용성(valuable), 고무(inspiring) 관점에 입각한 문제 정의
    • ③상상(IDEATE): 문제 해결을 위한 대안을 생각하는 것으로 사용자를 위한 해결책을 탐색하기 위해 아이디어 구성
    • ④프로토타입(PROTOTYPE): 가장 좋은 아이디어로 시험 제품을 제작하는 단계로서 시간 내에 머릿속에 있는 추상적인 아이디어를 구체적으로, 시각적으로 표현
    • ⑤테스트(TEST): 사용자에게 프로토타입을 사용할 기회를 제공하여 해결책을 정제하고 발전시킬 수 있는 기회를 만듬

     

    연습문제1

    데이터 분석에서는 하향식 접근 방식과 상향식 접근 방식으로 분석과제를 발굴하게 되는데, 다음 중 하향식 접근 방식의 단계에서 타당성 평가에 대한 설명으로 가장 부적절한 것은?
    ①도출된 분석 문제에 대한 대안을 과제화하기 위해서는 다각적 타당성 검토가 필요하다.
    ②경제적 타당성은 비용대비 효익의 관점에서 평가한다.
    ③데이터 타당성 확보를 위하여 문제발생 포인트에 대한 데이터 확보가 중요하다.
    ④기술적 타당성 분석 시 적용 가능한 요소기술 확보 방안에 대한 사전 고려가 필요하다.

    연습문제2

    디자인 사고 요소 중 관찰, 인터뷰, 감정이입을 통해서 사용자의 입장에서 공감하고 영감을 얻는 것이 중요하고, 나의 생각을 검증하는 것이 아니라 상대의 경험을 있는 그대로 받아들이는 것이 중요한 요소는 무엇인가?
    ①공감
    ②책임
    ③상상
    ④프로토타입

     

     08강Ⅱ-1-3 분석 과제 발굴3

    (ⅲ) 비지도 학습과 지도 학습

    • 지도학습(Supervised Learning)
      • 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning)의 한 방법이다. 
      • 훈련 데이터는 일반적으로 입력 객체에 대한 속성을 벡터 형태로 포함하고 있으며 각각의 벡터에 대해 원하는 결과가 무엇인지 표시되어 있다. 
      • 이렇게 유추된 함수 중 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고 주어진 입력 벡터가 어떤 종류의 값인지 표식하는 것을 분류(Classification)라 한다. 
      • 이 목표를 달성하기 위해서는 학습기가 "알맞은" 방법을 통하여 기존의 훈련 데이터로부터 나타나지 않던 상황까지도 일반화하여 처리할 수 있어야 한다. 사람과 동물에 대응하는 심리학으로는 개념 학습(Concept Learning)을 예로 들 수 있다.

     

    <참조> 회귀분석

    • (1) 회귀분석이란?
      • 통계학에서, 회귀 분석(regression analysis)은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한뒤 적합도를 측정해 내는 분석 방법이다. 
      • 회귀분석은 시간에 따라 변화하는 데이터나 어떤 영향, 가설적 실험, 인과 관계의 모델링등의 통계적 예측에 이용될 수 있다. 

     

    • (2) 회귀 분석의 표준 가정
      • 회귀분석은 다음의 가정을 바탕으로 한다. 
        • 1. 오차항은 모든 독립변수 값에 대하여 동일한 분산을 갖는다. (선형성)
        • 2. 오차항의 평균(기대값)은 0이다. (정규성)
        • 3. 수집된 데이터의 확률 분포는 정규분포를 이루고 있다.
        • 4. 독립변수 상호간에는 상관관계가 없어야 한다. (독립성)
        • 5. 시간에 따라 수집한 데이터들은 잡음의 영향을 받지 않아야 한다.
        • 독립변수들 간에 상관관계가 나타나는 경우 다중공선성 문제라고 한다. 

    • (3) 회귀 모형 적합도
      • 회귀모형의 적합도는 잔차 검정을 통해 확인한다. 
      • 잔차 검정은 정규성과 등분산성 가정을 만족하는지에 대한 검토 과정이다.

     

    • 비지도 학습(Unsupervised Learning)
      • 지도 학습과는 달리 정답을 알려주지 않고 비슷한 데이터를 군집화하여 미래를 예측하는 학습 방법이다. 라벨링이 되어 있지 않은 데이터로부터 패턴이나 형태를 찾기 쉽지 않다.
      • 실제로 지도 학습에서 적절한 특징(Feature)을 찾아내기 위한 전처리 방법으로 비지도 학습을 사용하기도 한다. 
      • 비지도 학습은 대표적으로 군집화(Clustering)가 있다.
      • 일반적으로 상향식 접근방식의 데이터 분석은 비지도 학습방법에 의해 수행된다.

     

    <참조> 클러스터 분석

    • 주어진 데이터들의 특성을 고려해 데이터 집단(클러스터)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾음
      클러스터 분석을 통해 수백만의 데이터를 직접 확인하지 않고 각각 클러스터의 대푯값만 확인해 전체 데이터의 특성을 파악할 수 있다.

     

    연습문제1

    훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning)의 한 방법에 해당하는 것은?
    ①지도학습 
    ②비지도 학습
    ③심화 학습
    ④강화 학습

    연습문제2

    주어진 데이터들의 특성을 고려해 데이터 집단을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법을 뜻하는 것은?
    ①ANOVA 
    ②클러스터 분석
    ③다중 회귀 분석
    ④선형 회귀 분석

     

     09강Ⅱ-1-3 분석 과제 발굴4

    (ⅳ) 프로토타이핑 접근법

    • 프로토타입이란?
      • 프로토타입(prototype)은 원래의 형태 또는 전형적인 예, 기초 또는 표준이다. 시제품이 나오기 전의 제품의 원형으로 개발검증과 양산 검증을 거쳐야 시제품이 될 수 있다.
      • 프로토타입은 '정보시스템의 미완성 버전 또는 중요한 기능들이 포함되어 있는 시스템의 초기모델’이다.
      • 이 프로토타입은 사용자의 모든 요구사항이 정확하게 반영할 때까지 계속해서 개선/보완 된다. 실제로 많은 애플리케이션들이 지속적인 프로토타입의 확장과 보강을 통해 최종 설계가 승인된다. 

    • 프로토타이핑 접근법이란?
      • 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해 보고 그 결과를 확인해 가면서 반복적으로 개선해 나가는 방법이다.
      • 프로토타이핑은 시스템의 초기모델을 세우고 다듬고, 다시 세우고 다듬고 하는 반복적인 과정을 통해서 이루어진다. 
      • 그러나 프로토타이핑은 무계획적인 반복과정을 지양하고 계획된 반복과정을 통해서 한 과정이 끝날 때마다 사용자의 요구를 좀더 정확하게 반영한 버전이 나오게 된다. 

     

    • 하향식 접근법 VS 프로토타이핑
      • 하향식 접근법은 문제가 정형화되어 있고 문제 해결을 위한 데이터가 완벽하게 조작에 존재할 경우에 효과적임
      • 반면에 프로토타이핑 접근법은 비록 완전하지 못하다 해도 신속하게 해결책이나 모형을 제시함으로써 이를 바탕으로 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화할 수 있게 하는 유용한 상향식 접근방법

     

    • 프로토타이핑 단계
      • 프로토타이핑의 과정은 4단계로 구분된다. 
      • [프로토타이핑 1단계]
        • 기본적인 사용자 요구사항을 분석한다. 시스템 설계자는 기본적인 요구사항이 도출되기까지 사용자와 함께 작업한다.
      • [프로토타이핑 2단계]
        • 시스템 설계자가 위에 단계에서 도출된 요구사항을 만족시키는 프로토타입을 4세대 언어(4GL : Forth-Generation Language)로 알려진 프로그래밍 언어 또는 CASE 도구를 이용하여 개발한다. 
        • 이때 프로토타입은 앞으로 개발될 시스템의 가장 핵심적인 기능 위주로 개발된다.
      • [프로토타이핑 3단계]
        • 사용자가 개발된 프로토타입을 실제 사용함으로써 요구사항이 이행되고 있는지를 확인하며 프로토타입의 보완을 위한 여러 가지 제안을 하게 된다.
      • [프로토타이핑 4단계]
        • 프로토타입의 수정과 보완이 이루어진다. 시스템 설계자는 사용자가 요구한 모든 제안사항과 이에 따르는 보완작업을 하게 된다. 프로토타입이 수정된 후에는 3단계로 돌아간다. 
        • 사용자가 만족할 때까지 3단계와 4단계는 계속 반복된다.

     

    • 프로토타이핑의 장단점
      • 장점
        • 프로토타이핑은 사용자 중심의 개발 방법이다. 프로토타이핑의 중요한 목적 중의 하나가 바로 최종사용자의 요구를 극대화하는 것이다.
        • 개발시간을 줄일 수 있다. 전통적인 방법으로는 운영 가능한 시스템이 나오기까지 오랜 시간이 걸리지만 프로토타이핑은 비교적 빠른 기간 안에 사용자가 평가할 수 있을 만한 결과를 만들어낸다.
        • 오류를 초기에 발견할 수 있다. 전통적인 방법으로는 시스템이 완성된 후에야 오류를 발견할 수 있다. 따라서 시스템 개발기간이 3년이라면 오류를 발견하기까지 적어도 3년의 시간이 소요될 수 있다. 그러나 프로토타이핑은 개발 초기단계에서 오류를 판별 할 수 있도록 해준다.
        • 변경이 용이하다. 사용자나 관리자는 현재까지의 개발 진행된 프로토타입을 직접 운영함으로써 여러 가지 제안과 변경할 점을 파악할 수 있고, 이러한 사항들은 진행되고 있는 개발과정에 반영하게 된다.
      • 단점
        • 시스템의 유지보수에 필수적인 시스템의 문서화 과정이 지나치게 축소되거나 생략될 수 있다. 단기적으로 볼 때는 이런 문서들이 별로 도움이 되지 않을 수 있다. 그러나 시간이 흐름에 따라 시스템의 수정과 보수가 필요하게 될 때, 시스템에 관련된 문서가 없다면 유지보수에 불필요한 노력이 따른다.
        • 최종적으로 시간과 비용이 훨씬 많이 들 수 있다. 프로토타이핑은 언제든지 변경이 용이하지만 이러한 시스템의 변경이 계속 될수록 시간과 비용은 많아지게 된다.
        • 프로토타이핑으로 완성된 시스템은 컴퓨터 자원의 활용 측면에서 볼 때 효율적이지 못하다. 이 개발방법은 자원의 효율성보다는 사용자 요구에 의해 개발되기 때문에 저장장치, 파일시스템, 중앙처리장치 등 하드웨어나 주변기기의 효율성이 무시되기 쉽다. 그러나 최근 컴퓨터 관련 기기들의 성능은 좋아지는 반면 가격은 하락하면서 이 문제의 비중은 크게 감소되고 있다.

     

    • 빅데이터 분석 환경에서 프로토타이핑의 필요성
      • 문제에 대한 인식 수준
        • 문제 정의가 불명확하거나 새로운 문제일 경우에 사용자 및 이해 관계자는 프로토타입을 이용하여 문제를 이해하고, 이를 바탕으로 구체화하는데 도움을 받을 수 있다.
      • 필요 데이터 존재 여부의 불확실성
        • 문제 해결을 위해 필요한 데이터의 집합이 모두 존재하지 않을 경우, 그 데이터의 수집을 어떻게 할 것인지 또는 그 데이터를 다른 데이터로 대체할 것인지 등에 대한 사용자와 분석자간의 반복적이고 순환적인 협의 과정이 필요.
      • 데이터 사용 목적의 가변성
        • 데이터의 가치는 사전에 정해진 수집목적에 따라 확정되는 것이 아니고, 그 가치가 지속적으로 변화할 수 있다. 따라서 조직에서 보유중인 데이터라 하더라도 기존의 데이터 정의를 재검토하여 데이터 사용 목적과 범위를 확대할 수 있을 것이다.

     

    • ④분석 과제 정의
      • 분석 과제 정의서를 통해 분석 별로 필요한 소스데이터, 분석 방법, 데이터 입수 및 분석의 난이도, 분석 수행주기, 분석 결과에 대한 검증, 상세 분석 과정 등을 정의한다.

     

    연습문제

    프로토타이핑 단계 중 기본적인 사용자 요구사항을 분석하고 시스템 설계자는 기본적인 요구사항이 도출되기까지 사용자와 함께 작업하는 단계는?
    ①1단계
    ②2단계
    ③3단계
    ④4단계

     

     10강Ⅱ-1-4 프로젝트 관리방안

    (1) 주요영역

    영역 내용
    데이터 복잡도
    (Data complexity)
    비정형 데이터의 통합 분석과 모델 선정 필요
    데이터 크기
    (Data Size)
    분석하고자 하는 데이터의 양
    속도
    (Speed)
    작업 종류에 따른 모델 분석 속도와
    활용 시나리오 (분석이 적용됐을 시의) 속도 고려
    정확도/정밀도
    (Accuracy& Precision)
    Accuracy 정확도와 Precision 정밀도는 Trade Off 관계에 있기 때문에 모델 해석 및 적용에 유의
    분석 복잡도
    (Analytic complexity)
    정확도와 모델 복잡성 사이의 기준을 정해 모델 해석 용이한 최적점 도출

     

    (2) 분석 프로젝트의 특성과 관리방안

    • ① 분석 프로젝트의 특성
      • 분석 프로젝트는 도출된 결과의 재해석을 통한 지속적인 반복 및 정교화가 수행되는 경우가 대부분이므로 프로토타이핑 방식의 섬세한 프로젝트 관리방식에 대한 고려가 필요하다.
      • 데이터 분석의 지속적인 반복 및 개선을 통하여 의도했던 결과에 더욱 가까워지는 형태로 프로젝트가 진행될 수 있도록 적절한 관리 방안 수립이 사전에 필요하다.
      • 또한 분석 프로젝트는 데이터 영역과 비즈니스 영역에 대한 이해뿐만 아니라 지속적인 반복이 요구되는 분석 프로세스의 특성을 이해한 프로젝트 관리방안을 수립하는 것이 중요하다.
      • 분석 과제정의서를 기반으로 프로젝트를 시작하되 지속적인 개선 및 변경을 염두해 두고 기간내에 가능한 최선의 결과를 도출할 수 있도록 프로젝트 구성원들과 협업하는 것이 분석 프로젝트의 특징

     

    • ② 관리 방안
    주제 그룹 개념 및 관련 프로세스
    범위 Scope 데이터의 형태와 양 또는 적용되는 모델에 따라 알고리즘 범위 변동 가능
    시간 Time 프로젝트 일정 관리
    원가 Cost 데이터 분석 비용
    품질 Quality 품질관리 (QC), 품질보증 (QA)에서 프로젝트 수행
    통합 Integration 프로젝트 통합 운영관리
    조달Procurement 외부 소싱 운영 (인프라 구매 또는 클라우드)
    자원 Resource 인력 공급, 아키텍처, 전문가 확보
    리스크 Risk 위험 식별 및 대응, 목표달성 미달 대응
    의사소통 Communication 원활한 프로젝트 진행을 위한 의사소통 체계 구축
    이해관계자 Stakeholdere 데이터, 비즈니스, 분석, 시스템 등의 전문가의 이해관계 식별 관리 중요

     

    연습문제1

    프로젝트 관리방안의 주요영역 중 텍스트, 오디오, 비디오 등의 비정형 데이터 및 다양한 시스템에 산재되어 있는 원천 데이터를 통합해서 분석 프로젝트를 진행할때는 초기 데이터의 확보와 통합 뿐 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요한 것은 무엇에 관한 설명인가?
    ① 데이터 복잡도
    ② 분석 복잡도
    ③ 데이터 크기
    ④ 정확도

     

    연습문제2

    분석 프로젝트의 관리방안 중 분석에 필요한 데이터 미확보로 분석 프로젝트 진행이 어려울 수 있으므로 관련 위험을 식별하고 대응방안을 사전에 수립해야 해야하는 것은 무엇에 관한 설명인가?
    ① 리스크
    ② 자원
    ③ 의사소통
    ④ 이해관계자

     11강Ⅱ-2-1 마스터 플랜 수립 프레임 워크

    (1) 마스터 플랜 수립

    • ① 마스터 플랜 수립이란?
      • 도출된 분석기회와 과제에서 우선순위를 평가하는 기준이 중요하다.
      • 우선순위, 적용범위/방식을 고려하여 플랜을 수립한다.

     

    • ISP와 같은 일반적인 IT 프로젝트의 과제 우선 순위 평가기준
      • 전략적 중요도
        • 전략적 필요성 : 전략적 목표 및 본원적 업무에 직접적인 연관 관계가 밀접한 정도
        • 시급성 : 사용자 요구사항, 업무능률 향상을 위해 시급히 수행되어야 하는지에 대한 정도
      • 실행 용이성
        • 투자 용이성 : 기간, 인력, 비용, 투자예산 확보
        • 기술 용이성 : 기술의 안정성, 유지보수 등 고려



    용어 정리

    • 투자자본수익률 (Return on investment, ROI): 투자자의 어떤 자원 투자로 인해 얻어진 이익을 말한다. 즉 높은 ROI는 투자비용 대비 좋은 성과 지표임
    • ISP: 조직의 목표 성공을 위한 전략적 측면과 조직의 목표 달성을 위한 정보화 계획, 절차 및 정보기술 적용 등과 같은 시스템 측면의 모형을 기획하고 설정하는 단계

     

    연습문제1

    전사 정보시스템을 기획하는 단계, 조직의 목표 성공을 위한 전략적 측면과 조직의 목표 달성을 위한 정보화 계획, 절차 및 정보기술 적용 등과 같은 시스템 측면의 모형을 기획하고 설정하는 단계를 나타내는 것은?
    ① ISP (Information Strategy Planning)
    ② ROI (Return on investment)
    ③ 비지도 학습(Unsupervised Learning)
    ④ 프로토타입(Prototype)

    연습문제2

    우선순위 평가 방법 및 절차 중 기간 및 인력 투입 용이성 정도, 비용 및 투자예산 확보 가능성 정도에 해당하는 내용으로 옳게 선택한 것은?
    ①실행 용이성 - 전략적 필요성
    ②전략적 중요도 - 투자 용이성
    ③실행 용이성 - 투자 용이성 
    ④실행 용이성 - 기술 용이성

     

     12강Ⅱ-2-1 마스터 플랜 수립 프레임 워크2

    (1) 마스터 플랜 수립

    • ROI 관점에서 빅데이터의 핵심 특징
    4V 3V
    난이도
    크기 (Volume) 데이터 규모, 투자비용 요소
    다양성 (Variety) 데이터 종류, 유형
    속도 (Velocity) 데이터 생성속도, 처리속도
    +
    1V
    시급성
    가치 (Value) 분석 결과 활용 및 실행을 통한 비즈니스 가치 비즈니스 효과

     

    • 우선순위 평가 기준
    우선순위 평가기준 내용 비고
    시급성
    Investment
    전략적 중요도와 목표가치에 부합하는지에 따른 시급성이 가장 중요한 기준이다. 시급성의 판단 기준은 전략적 중요도가 핵심이고 분석과제의 목표가치(KPI)를 함께 고려하여 시급성 여부 판단
    데이터 수집/가공/관리 비용, 분석 비용 및 수준
    비즈니스 효과
    난이도
    Return
    현 시점에서 과제를 추진하는 것이 비용 측면과 범위 측면에서 바로 적용하기 쉬운 것인지 또는 어려운 것인지에 대한 판단 기준으로서 적합성 여부 투자비용 요소

     

    • 우선순위 선정
      • 포토폴리오 사분면 분석을 통하여 과제 우선순위 선정 (4가지 유형)

     

     

    • ③ 이행계획 수립
      • 로드맵 수립
        • 분석과제에 대한 포트폴리오 사분면 분석을 통해 과제의 1차적 우선순위를 결정 
        • 분석 과제별 적용 범위 및 방식을 고려하여 최종적인 실행 우선순위를 결정한 후 단계적 구현 로드맵수립
        • 추진 과제별 선/후행 관계를 고려하여 단계별 추진 내용을 정렬
      • 세부 이행계획 수립
        • 각 단계마다 순차/반복 수행 필요 
        • 수집/분석 데이터를 준비 단계를 순차적으로 진행
        • 모델링 단계는 반복적으로 수행하는 혼합형을 많이 적용

     

    연습문제1

    <15회기출> 다음 중 분석 마스터플랜의 세부 이행계획 수립시 고려해야 할 데이터 분석체계(분석방법론)에 대한 설명으로 가장 적절한 것은?
    ① 데이터 분석 체계는 이해도가 높은 폭포수 모델이 가장 적정하다.
    ② 반복적 정렬 방식은 데이터 수집 및 확보 단계를 반복적으로 수행한다.
    ③ 프로토타입(Prototype) 모델은 데이터 분석체계로는 적절하지 못한다.
    ④ 프로젝트의 세부 일정계획도 데이터 분석체계를 고려하여 작성한다.

     

    연습문제2

    <16회기출> 다음 중 빅데이터 특징 4V를 고려한 분석 ROI에서 비즈니스 효과에 해당하는 것은?
    ① Volume
    ② Variety
    ③ Velocity
    ④ Value

     

     13강Ⅱ-2-2 분석 거버넌스 체계 수립

    (1) 거버넌스 체계란?

    • ① 거버넌스 체계란?
      • 거버넌스는 일반적으로, 그리고 학문적으로 빈번히 사용됨에도 불구하고, 그 다양한 의미로 인해 정의가 쉽지 않다. 이는 다양한 학문 분야에서 서로 다른 맥락으로 사용되고 있기 때문이다.
      • 존 피에르(Jon Pierre)와 피터스(B. Guy Peters)는 “정책 결정에 있어 정부 주도의 통제와 관리에서 벗어나 다양한 이해당사자가 주체적인 행위자로 협의와 합의 과정을 통하여 정책을 결정하고 집행해 나가는 사회적 통치 시스템”으로 정의했다.
      • 유엔 개발 계획은 “거버넌스란 한 국가의 여러 업무를 관리하기 위하여 정치, 경제 및 행정적 권한을 행사하는 것을 뜻한다. 거버넌스는 또한 시민들과 여러 집단이 자신들의 이해관계를 밝히고 그들의 권리를 행사하며, 자신들의 의무를 다하고, 그들 간의 견해 차이를 조정할 수 있는 복잡한 기구와 과정 등의 제도로서 구성된다.”라고 거버넌스를 정의했다.
      • 거버넌스 예시
        • (정책 결정 과정) 정부는 시민, 기업, 비정부 조직(NGO) 등 다양한 이해관계자의 의견을 수렴하여 정책을 결정. 예를 들어, 환경 정책을 수립할 때 환경 단체, 산업계, 학계 등과 협의하여 최종 결정을 내림
        • (투명성과 참여) 정부는 예산 편성 과정에서 시민들이 참여할 수 있도록 공개하고, 의견을 수렴하는 공청회를 개최

     

    • ② 거버넌스 분석 체계란?
      • 거버넌스 분석 체계는 기업에서 데이터를 이용한 의사 결정이 강조될수록 데이터 분석과 활용을 위한 체계적인 관리가 중요해짐
      • 따라서 단순히 대용량 데이터를 수집, 축적하는 것보다는 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 고려한 분석체계이다.

     

    • ③ 구성요소 5종
      • 지속적인 데이터 분석 고도화를 위하여 거버넌스 체계는 다음과 같은 구성요소들을 가진다.
        • 분석기획 및 관리 수행조직
        • 과제 기획 및 운영 프로세스
        • 분석관련 시스템
        • 데이터
        • 분석교육, 마인드 육성체계

     

    (2) 데이터 분석 수준진단

    • ① 개요
      • 기업들은 데이터 분석의 도입 여부와 활용에 명확한 분석 수준을 점검할 필요가 있기 때문에 데이터 분석의 수준 진단을 통하여 데이터 분석 기반을 구현할 수 있다.
      • 즉 데이터 분석을 위해 수준 진단 필요
        • (분석 준비도 6종) 업무, 인력/조직, 기법, 데이터, 문화, 인프라
        • (분석 성숙도 4종) 도입, 활용, 확산, 최적화
      • 분석의 유형/방향 결정

     

    연습문제1

    기업에서 데이터를 이용한 의사 결정이 강조될수록 데이터 분석과 활용을 위한 체계적인 관리가 중요해짐에 따라서 단순히 대용량 데이터를 수집, 축적하는 것보다는 어떤 목적으로 어떤 데이터를 어떻게 분석에 활용할 것인가가 고려한 분석체계는 무엇에 관한 설명인가?
    ① 거버넌스 분석 체계
    ② 회기 분석 체계
    ③ 데이터 마이닝
    ④ 머신러닝

     

    연습문제2

    데이터 분석 수준진단 중 분석준비도에 해당하지 않은 내용은?
    ① 분석업무
    ② 분석데이터
    ③ 분석기법
    ④ 분석확산

     

     14강Ⅱ-2-2 분석 거버넌스 체계 수립2

    분석 준비도 모델

    • 준비도 목표
      • 기업의 데이터 분석 도입의 수준을 파악하기 위한 진단 방법
    • 준비도 분류
      • 분석업무, 인력 및 조직, 분석 기법, 분석 데이터, 분석문화, IT인프라
    • 진단 과정
      • ⅰ) 영역별로 세부 항목에 대한 수준 파악
      • ⅱ) 진단결과 전체 요건 중 일정 수준 이상 충족하면 분석업무 도입
      • ⅲ) 충족하지 못할 시 분석 환경 조성
    분류 내용
    분석업무
    발생한 사실 분석업무 , 예측 분석업무,  시뮬레이션 분석업무,  최적화 분석업무, 분석업무 정기적 개선
    인력 및 조직
    분석 전문가 직무 존재, 분석 전문가 교육 훈련 프로그램,  관리자들의 기본적 분석 능력, 전사 분석업무 총괄 조직 존재, 경영진의 분석업무 이해 능력
    분석 기업
    업무별 적합한 분석기법 사용, 분석업무 도입 방법론, 분석기법 라이브러리, 분석기법 효과성 평가, 분석기법 정기적 개선
    분석 데이터
    분석업무를 위한 데이터 충분성/신뢰성/적시성
    비구조적 데이터 관리
    외부 데이터 활용 체계, 기준 데이터 관리
    분석 문화
    사실에 근거한 의사결정, 관리자의 데이터중시 정도, 회의 등에서 데이터 활용 상황, 데이터 공유 및 협업 문화
    IT 인프라
    운영시스템 데이터 통합, EAI, ETL 등 데이터 유통 체계, 분석 전용 서버 및 스토리지, 빅데이터 분석 환경, 통계 분석 환경, 비주얼 분석 환경

     

    분석 성숙도 모델

    • <참조> 조직의 성숙도 평가도구 CMMI 모델
      • 능력 성숙도 통합 모델(Capability Maturity Model Integration, CMMI)은 소프트웨어 개발 및 전산장비 운영 업체들의 업무 능력 및 조직의 성숙도를 평가하기 위한 모델을 말한다. 
      • CMMI는 기존 능력 성숙도 모델(CMM)을 발전시킨 것으로서, 기존에 소프트웨어 품질보증 기준으로 사용되언 SW-CMM과 시스템 엔지니어링 분야의 품질보증 기준으로 사용되던 SE-CMM을 통합하여 개발한 후속 평가 모델이다. 
      • CMMI는 1~5단계까지 있으며, 5단계가 가장 높은 수준이다. CMMI는 소프트웨어 개발 및 전산장비 운영 분야의 품질 관련 국제 공인 기준으로 사용되고 있다
      • 성숙도 수준분류
        • 도입 단계, 활용 단계, 확산 단계, 최적화 단계
    단계 도입 활용 확산 최적화
    비즈니스
    실적분석 및 통계
    정기보고 수행
    운영 데이터 기반
    미래 결과 예측
    시뮬레이션
    운영 데이터기반
    전사 성과 실시간
    분석규칙 관리
    이벤트 관리
    외부 환경분석 활용
    최적화 업무 적용
    실시간 분석
    비즈니스 모델 진화
    조직,역량
    일부 부서에서 수행
    담당자 역량에 의존
    전문 담당부서에서 수행
    분석기법 도입
    관리자가 분석수행
    전사 모든 부서 수행
    분석 COE조직 운영
    데이터 사이언티스트 확보
    데이터 사이언스 그룹
    경영진 분석활용
    전략 연계
    IT부문
    데이터 웨어하우스
    데이터 마트
    ETL/EAI
    OLAP
    실시간 대시보드
    통계분석 환경
    빅데이터 관리 환경
    시뮬레이션, 최적화
    비주얼 분석
    분석 전용 서버
    분석 협업환경
    분석 sandbox
    프로세스 내재화
    빅데이터 분석

     

    • <참조> (1) ETL
      • 추출, 변환, 적재(Extract, transform, load, ETL)는 컴퓨팅에서 데이터베이스 이용의 한 과정으로 특히 데이터 웨어하우스에서 다음을 아우른다: 
        • 동일 기종 또는 타기종의 데이터 소스로부터 데이터를 추출한다.
        • 조회 또는 분석을 목적으로 적절한 포맷이나 구조로 데이터를 저장하기 위해 데이터를 변환한다. 
        • 최종 대상(데이터베이스, 특히 운영 데이터 스토어, 데이터 마트, 데이터 웨어하우스)으로 변환 데이터를 적재한다.
           
    • <참조> (2) EAI
      • 기업 응용 프로그램 통합(영어: Enterprise Application Integration, EAI) 또는 기업 애플리케이션 통합은 기업용 응용 프로그램의 구조적 통합 방안을 가리킨다. 전사적 응용 프로그램 통합이라고도 한다.

    • <참조> (3) OLAP
      • 온라인 분석 처리(Online Analytical Processing, OLAP)는 의사결정 지원 시스템 가운데 대표적인 예로, 사용자가 동일한 데이터를 여러 기준을 이용하는 다양한 방식으로 바라보면서 다차원 데이터 분석을 할 수 있도록 도와준다.
      • OLAP는 1993년 에드거 F. 커드에 의해 처음 제안된 것
      • OLAP을 사용자가 다차원 정보에 직접 접근하여 대화 형태로 정보를 분석하고 의사결정에 활용하는 과정이라고 정의하였다. 
      • OLAP란 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정에서 등장하였다. 
      • 사용자는 온라인상에서 직접 데이터에 접근하며, 대화식으로 정보를 분석하므로 사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원하는 데 그 목적이 있다. 

     

    분석 수준 진단 결과

    • 기업의 현재 분석 수준을 객관적으로 파악
    • 경쟁사의 분석 수준과 비교하여 분석 경쟁력 확보 및 강화를 위한 목표수준 설정 가능
    • 분석 관점에서의 사분면 분석
      • (정착형) 준비도는 낮으나 인력/조직, 분석기법 등을 기업 내부에서 제한적으로 사용 중
      • (준비형) 기업에 필요한 데이터, 인력/조직, 분석업무, 분석기법 등이 미 적용
      • (확산형) 기업이 필요한 6가지 분석 구성요소를 갖추고 있고 부분적으로 도입/확산 중
      • (도입형) 기업에서 활용하는 분석업무, 기법 등은 부족하나 준비도가 높아 즉시 도입 가능

     

    (3) 분석지원 인프라 방안 수립

    • ① 개요
      • 분석과제 단위별로 별도의 분석시스템을 구축하는 경우, 관리의 복잡도 및 비용의 증대라는 부작용이 나타날 수 있음
      • 따라서 분석 마스터 플랜을 기획하는 단계에서부터 장기적이고 안정적으로 활용할 수 있는 확장성을 고려한 플랫폼 구조를 도입하는 것이 적절하다
    개별 시스템 플랫폼 구조
    시스템간 자체적 데이터 교환 분석 플랫폼을 활용한 공동기능 활용
    시스템별 독립적인 데이터 관리 중앙집중적 데이터 관리
    확장시 시스템간 인터페이스 폭증 확장시 시스템간 인터페이스 최소화

     

    • ② 플랫폼
      • 단순한 분석 응용프로그램 뿐만 아니라 분석 서비스를 위한 응용프로그램이 실행될 수 있는 기초를 이루는 컴퓨터 시스템을 의미
      • 일반적으로 하드웨어에 탑재되어 데이터 분석에 필요한 프로그래밍 환경과 실행 및 서비스 환경을 제공하는 역할을 수행

     

    연습문제1

    분석지원 인프라 방안 수립의 플랫폼 구조에 해당하는 내용이 아닌 것은?
    ① 분석 플랫폼을 활용한 공동기능 활용
    ② 중앙집중적 데이터 관리
    ③ 확장시 시스템간 인터페이스 최소화
    ④ 시스템간 자체적 데이터 교환

    연습문제2

    분석 성숙도 진단 분류의 IT부문의 ‘도입’에 해당하는 내용이 아닌 것은?
    ① 데이터 웨어하우스
    ② 데이터 마트
    ③ ETL
    ④ 통계분석 환경

     15강Ⅱ-2-2 분석 거버넌스 체계 수립3

    (4) 데이터 거버넌스 체계 수립

    • ① 데이터 거버넌스 체계란?
      • 회사 전체에서 사용하는 모든 데이터를 효과적으로 관리하기 위해서 규칙, 지침 (가이드), 조직을 포함함
      • 이를 위해 표준화 관리 체계를 수립하고 프레임워크 및 저장소를 운영/구축
      • 프레임워크: 데이터 관리의 전반적인 가이드라인 제공
      • 저장소: 데이터 효율적인 운영을 위한 인프라
      • 인프라: 비정형/정형/반정형 데이터, 하드웨어, 소프트웨어 등 의미
    체계 내용
    데이터 표준화
    데이터 표준용어 설정, 명명규칙 수립, 메타 데이터 구축, 데이터 사전 구축 등의 업무
     
    데이터 표준 용어 설정: 고객 데이터베이스에서 고객 이름을 저장할 때, "First_Name", "Last_Name" 형식
    명명 규칙 수립: 제품 테이블의 이름을 "product_table"로, 주문 테이블의 이름을 "order_table"로 명명
    메타 데이터 구축: 고객 데이터 필드에 대해 "Customer_ID", "Customer_Name" 각 필드의 의미 전달
    데이터 사전 구축: 모든 데이터 필드와 테이블에 대한 정의와 규칙을 기록한 데이터 사전을 작성
    데이터 관리 체계
    정합성 및 활용성 확보: 고객 데이터를 정기적으로 검증하여 중복된 데이터를 제거하고, 이메일 주소 형식을 일관되게 유지
    항목별 상세한 프로세스 마련: 고객 데이터를 수집할 때, 데이터를 입력하는 절차와 검증 단계를 명확히 정의
    데이터 생명 주기 관리: 고객 데이터의 생성, 업데이트, 삭제 시점을 명확히 정의하고, 보존 기간이 지난 데이터는 자동으로 삭제하는 정책을 수립
    비용 관리: 데이터 압축 기술을 사용하여 저장 공간을 절약하고, 아카이브 시스템을 도입하여 오래된 데이터를 효율적으로 관리합니다.
    데이터 저장소 관리 메타데이터 및 표준 데이터 저장소 구성: 중앙 집중형 데이터 웨어하우스를 구축하여 모든 데이터를 중앙에서 관리하고 분석
    워크플로우 및 소프트웨어 지원: 데이터 통합 도구를 사용하여 다양한 소스에서 데이터를 수집하고, 일관된 형식으로 변환하여 저장
    시스템 통제: 모든 데이터 접근은 중앙 관리 시스템을 통해 이루어지도록 하여 데이터의 무결성을 유지
    사전 영향 평가: 데이터베이스 스키마 변경 시, 테스트 환경에서 사전 평가를 통해 영향을 분석하고, 실제 시스템에 적용합니다.
    표준화 활동 표준 준수 여부 점검: 매 분기마다 데이터 관리 감사(audit)를 실시하여 표준 준수 여부를 점검
    조직 내 안정성 유지: 새로운 데이터 관리 정책이 도입될 때마다 전체 시스템에 적용하고, 모든 관련자들에게 교육을 실시
    교육 및 개선 활동: 정기적인 데이터 관리 교육 프로그램을 운영하여 모든 직원이 데이터 거버넌스 체계를 이해하고 준수하도록 합니다.

     

    • <참조>  (1) 메타데이터
      • 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터
      • 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터
      • 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말함
      • 예제) 디지털 카메라에서는 사진을 찍어 기록할 때마다 카메라 자체의 정보와 촬영 당시의 시간, 노출, 플래시 사용 여부, 해상도, 사진 크기 등의 사진 정보를 화상 데이터와 같이 저장하게 되어 GPS 기능을 사용하여 위치 정보까지 사진의 메타데이터에 입력할 수도 있다.

    • <참조> (2) 데이터 사전
      • 데이터 사전(data dictionary)는 시스템 전체에서 나타나는 데이터 항목들에 대한 정보를 지정한 중앙 저장소이다. 
      • 이 정보에는 항목을 참조하는데 사용되는 식별자, 항목에 대한 엔티티의 구성요소, 항목이 저장되는 곳, 항목을 참조하는 곳 등을 포함한다.

     

    • ② 데이터 거버넌스 구성요소
      • 데이터 거버넌스 체계는 구성요소인 원칙, 조직, 프로세스가 유기적으로 조합하여 최적의 정보 서비스를 제공
    구분 내용 예시
    원칙
    데이터를 유지, 관리하기 위한 지침과 가이드
    보안, 품질기준, 변경관리
    데이터 유지 및 관리: 회사는 모든 고객 데이터를 매일 백업하고, 최소 5년간 보존
    보안: 고객 데이터는 암호화된 상태로 저장되며, 데이터베이스 접근은 관리자만 가능
    품질 기준: 데이터 입력 시 필수 필드가 누락되지 않도록 검증 절차를 도입
    변경 관리: 데이터베이스 구조 변경 시, 사전 검토 회의를 거쳐 승인 후 변경
    조직
    데이터를 관리할 조직의 역할과 책임
    데이터 관리자, 데이터베이스 관리자, 데이터 아키텍트
    데이터 관리자: 고객 데이터베이스에 새로운 고객 정보를 추가하고, 오류를 수정
    데이터베이스 관리자(DBA): 데이터베이스 백업을 수행하고, 성능 저하 문제를 해결
    데이터 아키텍트: 신규 데이터 분석 요구사항에 맞춰 데이터 모델을 설계
    프로세스
    데이터 관리를 위한 활동과 체계
    작업 절차, 모니터링 활동, 측정 활동
    작업 절차: 고객 정보를 수집할 때, 웹 양식을 통해 데이터를 입력 및 검증 수행
    모니터링 활동: 매주 데이터 품질 보고서를 작성하여 데이터 오류를 검토/보완
    측정 활동: 분기별로 데이터 정확성 평가하여 개선 작업 수행

     

    연습문제1

    데이터 거버넌스 체계는 구성요소인 원칙, 조직, 프로세스가 유기적으로 조합, 효과적으로 관리하여 데이터를 비즈니스 목적에 부합하도록 하고 최적의 정보 서비스를 제공할 수 있도록 한다. 데이터를 유지, 관리하기 위한 지침과 가이드에 해당하는 구성요소는?
    ①원칙
    ②조직
    ③프로세스
    ④태스크

    연습문제2

    다음 중 아래의 데이터 거버넌스 체계가 설명하는 항목은?

    메타데이터 관리, 데이터 사전관리, 데이터 생명주기 관리

    ①데이터 표준화
    ②데이터 관리 체계
    ③데이터 저장소 관리
    ④표준화 활동

     

     16강Ⅱ-2-2 분석 거버넌스 체계 수립4

    (5) 데이터 분석 조직 및 인력방안 수립

    • ① 데이터 분석 조직의 개요
      • 데이터 분석 조직은 기업의 경쟁력 확보를 위해 데이터 분석의 가치를 발견하고, 이를 활용하여 비즈니스를 최적화하는 목표를 갖고 구성되어야 한다. 
        • 수익 창출 > 안정적인/고정적인 수익 극대화
      • 다양한 분야의 지식과 경험을 가진 인력과 업무 담당자 등으로 구성된 전사 또는 부서 내 조직으로 구성할 수 있다.
    분류 내용
    목표 기업의 경쟁력 확보를 위하여 비즈니스 질문(question)과 이에 부합하는 가치(Value)를 찾고 비즈니스를 최적화(Optimization)하는 것
    역할 전자 및 부서의 분석 업무를 발굴하고 전문적 기법과 분석 도구를 활용하여 기업 내 존재하는 빅데이터 속에서 인사이트(insight)를 전파하고 이를 행동화 하는 것
     
    분석 업무 발굴: 마케팅 부서에서는 고객에게 맞춤형 마케팅 캠페인을 제공하기 위해 고객 세분화 필요
    전문적 기법: 클러스터링 알고리즘을 사용하여 고객을 유사한 그룹으로 분류
    도구 활용: Python의 scikit-learn 라이브러리를 사용하여 K-평균 클러스터링을 수행합니다.
    인사이트 도출: 고객을 나이, 구매 패턴, 관심사 등을 기준으로 여러 그룹으로 분류
    인사이트 전파: 분석 결과를 마케팅 팀에 공유하여 각 고객 그룹에 맞춤형 마케팅 전략을 제안
    행동화: 캠페인 성과를 모니터링하고, 피드백을 통해 캠페인 전략을 지속적으로 개선
    구성 기초통계학 및 분석 방법에 대한 지식과 분석 경험을 가지고 있는 인력으로 전사 또는 부서 내 조직으로 구성하여 운영

     

    • ② 조직 및 인력 구성 시 고려사항 
      • 조직구조의 고려사항
        • 비즈니스 질문을 선제적으로 찾아 낼 수 있는 구조인가?
        • 분석 전담조직과 타 부서간 유기적 협조와 지원이 원활한 구조인가?
        • 효율적인 분석 업무를 수행하기 위한 분석 조직의 내부 조직 구조는?
        • 전사 및 단위부서가 필요시 접촉하여 지원할 수 있는 구조인가?
        • 어떤 형태의 조직으로 구성하는 것이 효율적인가?
      • 인력구성의 고려사항
        • 비즈니스 및 IT 전문가의 조합으로 구성되어야 하는가?
        • 어떤 경험과 어떤 스킬을 갖춘 사람으로 구성해야 하는가?
        • 통계적 기법 및 분석 모델링 전문 인력을 별도로 구성해야 하는가?
        • 전사 비즈니스를 커버하는 인력이 없을 때 대책은?
        • 전사 분석업무에 대한 적합한 인력 규모는 어느 정도인가?
    집중 구조 기능 구조 분산 구조

    전사, 분석업무를 별도의 분석전담 조직에서 담당
    전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행가능
    현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
    일반적인 분석 수행구조
    별도 분석조직이 없고 해당 업무 부서에서 분석 수행
    전사적 핵심분석이 어려우며, 부서 현황 및 실적 통계 등 과거 실적에 국한된 분석 수행 가능성
    분석조직 인력들을 현업부서로 직접 배치하여 분석업무 수행
    전사차원의 우선순위 수행
    분석결과에 따른 신속한 액션가능
    부서 분석업무와 역할 분담은 명확히 해야함

     

    • ③ 분석조직의 인력구성
      • 전문역량을 갖춘 각 분야의 인재들을 모아 조직을 구성하여 분석조직의 경쟁력을 극대화
        • 비즈니스 인력: 해당 비즈니스를 잘 이해하고 분석 요소를 찾고 협의 인력
        • IT 기술 인력: 분석에 필요한 IT 기술 동향 및 기술 아키텍처를 수립 인력
        • 분석 전문 인력: 고급 통계 분석 기법을 이해하고 다양한 예측 모델링을 설계/검증 인력
        • 변화 관리 인력: 경영층 대상으로 분석 문화 확산을 위한 변화 관리를 담당 인력
        • 교육담당 인력: 분석조직에게 다양한 분석기법에 대한 심도 있는 교육 인력

     

    연습문제1

    인력구성의 고려사항이 아닌 것은?
    ① 비즈니스 질문을 선제적으로 찾아 낼 수 있는 구조인가?
    ② 비즈니스 및 IT 전문가의 조합으로 구성되어야 하는가?
    ③ 어떤 경험과 어떤 스킬을 갖춘 사람으로 구성해야 하는가?
    ④ 통계적 기법 및 분석 모델링 전문 인력을 별도로 구성해야 하는가?

    연습문제2

    분석 조직 구조중 ‘집중구조’에 해당하는 설명이 아닌 것은?
    ①전사, 분석업무를 별도의 분석전담 조직에서 담당
    ②전략적 중요도에 따라 분석조직이 우선순위를 정해서 진행가능
    ③현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
    ④부서 분석업무와 역할 분담은 명확히 해야함

     17강Ⅱ-2-2 분석 거버넌스 체계 수립5

    (6) 분석 과제 관리 프로세스 수립

    • ① 개요
      • 분석 마스터 플랜이 수립되고 데이터 분석 과제가 성공적으로 수행되는 경우, 지속적인 분석 니즈 및 기회가 도출됨
      • 이러한 분석 과제를 효과적으로 기획/운영이 요구되기 때문에 체계적인 분석 과제 관리 프로세스 수립 필요
    • ② 과제 관리 프로세스
      • 과제 발굴
        • 개별 조직이나 개인이 도출한 분석 아이디어를 발굴하고 이를 과제화하여 분석 과제 풀(Pool)로 관리하면서 분석 프로젝트를 선정하는 작업을 수행한다.
      • 과제 수행
        • 분석을 수행할 팀을 구성하고 분석 과제 실행시 지속적인 모니터링과 과제결과를 공유하고 개선하는 절차를 수행한다. 
        • 해당 과제를 진행하면서 만들어진 시사점을 포함한 결과물을 풀에 잘 축적하고 관리함으로써 향후 유사한 분석과제 수행시 시행착오를 최소화하고 프로젝트를 효율적으로 진행할 수 있다.

     

    (7) 분석 교육 및 변화 관리

    • ① 개요
      • 빅데이터의 등장으로 많은 비즈니스 영역에서 시시각각 변화를 적극 대응하기 위해서는 기업에 맞는 적합한 분석 업무를 도출하고, 가치를 높여줄 수 있도록 분석 조직 및 인력에 대한 지속적인 교육과 훈련을 실시해야 한다. 
      • 또한 경영층이 사실 기반 의사결정을 할 수 있는 문화를 정착시키는 등 지속적인 변화관리를 계획하고 수행해야 한다.
    • ② 분석 교육 목표
    분류 내용 예시
    분석 기획자 데이터 분석 큐레이션 교육
    데이터 큐레이션 교육을 통해 다양한 데이터를 통합
    분석 목적에 맞는 데이터를 수집/전처리 방법
    분석 실무자 데이터 분석 기법 및 도구에 대한 교육
    Python, R, SQL 등 데이터 분석 도구의 사용법
    통계 분석, 머신 러닝 등의 기법을 배우는 교육
    업무 수행자 분석기회 발굴, 구체화, 시나리오 작성법
    분석 결과를 바탕으로 비즈니스 전략을 수립
    이를 실현하기 위한 구체적인 시나리오 작성법 배움

     

    • <참조> 빅데이터 시대의 변화에 적극적인 대응방법
      • 기업에 맞는 적합한 분석업무의 수행
      • 분석조직 및 인력에 대한 지속적인 교육과 훈련 실시
      • 경영층이 사실기반 의사결정을 할 수 있는 문화 정착
      • 지속적인 변화관리를 계획하고 수행, 업무 수행자에 대한 분석기회 발굴, 구체화, 시나리오 작성법 등을 고려

     

    연습문제1

    분석 교육의 목표 중 데이터 분석 큐레이션 교육을 목표로 하는 담당자는?
    ①분석 기획자
    ②분석 실무자
    ③업무 수행자
    ④취업 교육자

    연습문제2

    빅데이터 시대의 변화에 적극적인 대응방법으로 옳지 못한 것은?
    ①기업에 맞는 적합한 분석업무의 수행
    ②분석조직 및 인력에 대한 지속적인 교육과 훈련 실시
    ③경영층에 대한 의사결정 관여하지 않음
    ④지속적인 변화관리를 계획하고 수행

     

     참고 문헌

    [논문]

    • 없음

    [보고서]

    • 없음

    [URL]

    • 없음

     

     문의사항

    [기상학/프로그래밍 언어]

    • sangho.lee.1990@gmail.com

    [해양학/천문학/빅데이터]

    • saimang0804@gmail.com
    • 네이버 블러그 공유하기
    • 네이버 밴드에 공유하기
    • 페이스북 공유하기
    • 카카오스토리 공유하기