대외활동/자격증

[ADsP] 과목 2 - 1장 정리

케이와이엠 2023. 3. 22. 13:32

2- 1장. 데이터 분석 기획의 이해

 

1절. 분석 기획 방향성 도출

* 데이터 사이언티스트 3가지 영역

1) 수학/통계학적 지식

2) 정보 기술(IT기술, 해킹기술, 통신기술 등)

3) 비즈니스

 

* 분석의 대상(What)과 분석의 방법(How)에 따른 분석 유형 4가지

1) 최적화(Optimization) What O, How O

2) 통찰(Insight) What X, How O

3) 해법(Solution) What O, How X

4) 발견(Discovery) What X, How X

 

* 목표 시점별 분석 기획 방안

1) 과제 중심적인 접근 방식 : 당면한 과제를 빠르게 해결

문제 해결을 위함 / 목표 - Speed & Test / 과제유형 - Quick-Win / 접근방식 - Problem Solving

2) 장기적인 마스터플랜 방식 : 지속적인 분석 내재화

분석 과제 정의를 위함 / 목표 - Accuracy & Deploy / 과제유형 - Long Term View / 접근방식 - Problem Definition

 

* 분석 기획 시 고려사항

1) 가용 데이터(Available data) : 데이터의 확보 & 유형 파악

2) 유즈케이스(Proper Business Use Case) 탐색 : 적절한 활용방안과 유즈케이스 & 최대한 기존에 있는 유사 솔루션 활용

3) 장애요소(Low Barrier Of Execution) : 가격(비용 대비 효과의 적정한 비용) & 단순함(이해도 높으면서 단순한 모형) & 성능(안정적 성능 확보) & 문화(내재화) -> 조직의 역량으로 내재화하기 위한 변화 관리

4) 변환 관리(Change Management)

 

* 데이터 유형

1) 정형 데이터 - ERP, CRM, SCM 등 데이터 자체로 분석이 가능. 데이버터베이스로 관리

2) 반정형 데이터 - 로그 데이터, 모바일 데이터, 센싱 데이터 등 데이터 자체로 분석이 가능하지만 해석이 불가능하여 메타정보를 활용해야 해석이 가능

3) 비정형 데이터 - 영상, 음성, 문자 등 데이터 자체로 분석이 불가능하여 분석 데이터로 변경 후 분석


2절. 분석 방법론

1. 개요

데이터 분석이 정착하기 위해서는 이를 체계화한 절차와 방법이 정리된 데이터 분석 방법론의 수립이 필수적

상세한 절차, 방법, 도구와 기법, 템플릿과 산출물로 구성됨.

 

* 기업의 합리적 의사결정을 가로막는 장애요소

1) 고정관념(Stereotype)

2) 편향된 생각(Bias)

3) 프레이밍 효과(Framing Effect : 문제의 표현 방식에 따라 동일한 사건이나 상황임에도 불구하고 개인의 판단이나 선택이 달라질 수 있는 현상)

 

* 암묵지 : 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식 (상호 작용 : 공통화, 내면화)

* 형식지 : 문서나 매뉴얼처럼 형상화된 지식 (상호 작용 : 표출화, 연결화)

 

* 방법론의 생성과정

1) 방법론 -> 암묵지 (내재화)

2) 암묵지 -> 형식지 (형식화)

3) 형식지 -> 방법론 (체계화)

 

* 방법론의 적용 업무의 특성에 따른 모델

1) 폭포수 모델(Waterfall Model) : 단계를 순차적으로 진행하는 방법으로, 이전 단계가 완료되어야 다음 단계로 진행될 수 있으며 문제가 발견될 시 피드백 과정이 수행된다. (기존 IT의 SW 개발 방식)

2) 프로토타입 모델(Prototype Model) : 폭포수 모델의 단점을 보완. 일부분을 우선개발하여 제공한 뒤에, 사용자의 요구를 분석하거나 평가해서 그 결과를 통한 개선작업 시행.

3) 나선형 모델(Spiral Model) : 반복을 통해 점증적으로 개발하는 방법으로, 처음 시도하는 프로젝트에 적용이 용하지만 관리 체계를 효과적으로 갖추지 못한 경우 복잡도가 상승하여 프로젝트 진행이 어려울 수 있다.

 

*방법론의 구성

단계 > 태스크 > 스탭

 

 

2. KDD 분석 방법론

 

* 분석 절차

1) 데이터셋 선택 (selection)

- 비즈니스 도메인에 대한 이해

- 프로젝트 목표 설정

- 데이터마이닝에 필요한 목표 데이터(target data)를 구성

 

2) 데이터 전처리 (preprocessing)

- 잡음(Noise)과 이상치(Outlier), 결측치(Missing Value)를 식별-> 제거 OR 재처리

- 추가로 요구되는 데이터 셋이 필요한 경우 데이터 선택 프로세스를 재실행한다.

 

3) 데이터 변환 (transformation)

- 목적에 맞는 변수 찾기

- 데이터의 차원을 축소 -> 효율적인 데이터마이닝

- 학습용 데이터(training data)와 검증용 데이터(test data)로 데이터를 분리하는 단계이다.

 

4) 테이터 마이닝 (data mining)

** 의미 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 분석하여 가치있는 정보를 추출하는 과정

- 분석목적에 맞는 데이터마이닝 기법을 선택하고, 적절한 알고리즘을 적용하여 데이터마이닝 작업을 실행

- 필요에 따라 데이터 전처리와 데이터 변환 프로세스를 추가로 실행하여 최적의 결과를 산출한다.

 

5) 결과 평가 (interpretation / evaluation)

- 결과에 대한 해석과 평가

- 분석 목적과의 일치성을 확인한다.

- 데이터마이닝을 통해 발견한 지식을 업무에 활용하기 위한 방안 마련의 단계이다.

 

3. CRISP-DM 분석 방법론 - 4레벨 , 6단계

 

* CRISP-DM의 4 레벨 구조

- 최상위 레벨은 여러 개의 단계(Phases)로 구성

-> 각 단계는 일반화 태스크(Generic Tasks)를 포함

-> 구체적인 수행 레벨인 세분화 태스크(Specialized Tasks)로 구성

-> 프로세스 실행(process instances)은 데이터 마이닝을 위한 구체적인 실행을 포함

- 예를 들어 데이터 정제(Data Cleansing)라는 일반화 태스크 범주형 데이터 정제와 연속형 데이터 정제와 같은 세분화 태스크로 구성된다.

 

* CRISP-DM의 프로세스 6단계

1) 업무 이해 (Business Understanding)

- 비즈니스 관점에서 프로젝트의 목적과 요구사항을 이해

- 도메인 지식으로 문제 정의

- 초기 프로젝트 계획을 수립하는 단계

수행 업무) 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립

 

2) 데이터 이해 (data understanding)

- 데이터 수집 & 데이터 속성 이해

- 인사이트 발견

수행 업무) 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인

 

3) 데이터 준비 (data preparation)

- 수집된 데이터에서 분석기법에 적합한 데이터를 편성하는 단계(많은 시간이 소요 될 수 있음)

수행 업무) 분석용 데이터 셋 선택, 데이터 정제, 분석용 데이터 셋 편성, 데이터 통합, 데이터 포맷팅

 

4) 모델링 (modeling)

- 모델링 기법 & 알고리즘 선택 -> 파라미터 최적화

- 모델링 과정에서 데이터 셋이 추가로 필요한 경우 데이터 준비 단계를 반복 수행

- 모델의 과적합(Over-fitting) 문제 확인

수행 업무) 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가

 

5) 평가 (evaluation)

- 프로젝트 목적에 부합하는지 평가

- 데이터마이닝 결과를 최종적으로 수용 할 것인지 판단

수행 업무) 분석결과 평가, 모델링 과정 평가, 모델 적용성 평가

 

6) 전개 (deployment)

- 완성된 모델을 실 업무에 적용하기 위한 계획을 수립하는 단계

- 모니터링과 모델의 유지보수 계획 마련

- CRISP-DM의 마지막 단계, 프로젝트 종료 관련 프로세스를 수행하여 프로젝트 마무리

수행 업무) 전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료보고서 작성, 프로젝트 리뷰

 

=> 각 단계는 폭포수 모델(x) , 각 단계간의 피드백을 거친다

 

4 . KDD 와 CRISP-DM 비교

 

5. 빅데이터 분석 방법론

 

* 빅데이터 분석의 계층적 프로세스

1) 단계(Phase) : 프로세스 그룹(Process Group)을 통하여 완성된 단계별 산출물이 생성된다. 각 단계는 기준선(Baseline)으로 설정되어 관리되어야 하며, 버전관리(Configuration Management) 등을 통하여 통제가 이루어져야 한다.

2) 태스크(Task) : 각 단계는 여러 개의 태스크(Task)로 구성된다. 각 태스크는 단계를 구성하는 단위 활동이며, 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있다.

3) 스텝(Step) : WBS(Work Breakdown Structure)의 워크 패키지(Work Package)에 해당되고 입력 자료(Input), 처리 및 도구(Process&Tool), 출력자료(Output)로 구성된 단위 프로세스(Unit Process)이다.

 

* 빅데이터 분석 방법론의 5단계

1) 분석 기획(Planning) : 비즈니스 이해 및 범위 설정 / 프로젝트 정의 및 계획 수립 / 프로젝트 위험 계획 수립

2) 데이터 준비(Preparing) : 원천 데이터를 정의 / 데이터 스토어 설계 / 데이터 수집 및 정합성 점검

3) 데이터 분석(Analyzing) : 분석용 데이터 준비 / EDA(탐색) / 모델링 / 모델링 평가 및 검증 / 모델 적용 및 운영방안 수립

- 추가적인 데이터 확보가 필요한 경우 데이터 준비 단계로 피드백(Feedback)하여 두 단계를 반복하여 진행한다.

4) 시스템 구현(Developing) : 설계 및 구현 / 시스템 테스트 및 운영

- 시스템 개발을 위한 사전 검증으로 프로토타입 시스템을 구현한다.

5) 평가 및 전개(Lesson Learned) : 모델 발전계획 수립 / 프로젝트 평가 및 보고

 

 

*단계별 세부 단계 및 실제 업무

1) 분석 기획 (**순서**)

[비즈니스 이해 및 범위 설정] : 비즈니스 이해 -> 프로젝트 범위 설정(프로젝트 범.위. 정의서 SOW)

[프로젝트 정의 및 계획 수립] : 데이터 분석 프로젝트 정의 -> 프로젝트 수행 계획 수립

[프로젝트 위험 계획 수립] : 데이터 분석 위험 식별 -> 위험 대응 계획 수립

 

2) 데이터 준비

[필요 데이터 정의] : 데이터 정의 -> 데이터 획득방안 수립

[데이터 스토어 설계 (데이터의 효율적인 저장과 활용을 위함)] : 정형 데이터 스토어 설계 -> 비정형 데이터 스토어 설계

[데이터 수집 및 정합성 점검] : 데이터 수집 및 저장 -> 데이터 정합성 점검

 

3) 데이터 분석

[분석용 데이터 준비] : 비즈니스 룰 확인( 분석에 필요한 데이터의 범위 확인) -> 분석용 데이터 셋 준비

[텍스트 분석] : 텍스트 데이터 확인 및 추출 -> 텍스트 데이터 분석

[탐색적 분석] : 탐색적 데이터 분석 -> 데이터 시각화

[모델링] : 데이터 분할 -> 데이터 모델링 -> 모델 적용 및 운영 방안

[모델 평가 및 검증] : 모델 평가 -> 모델 검증

 

4) 시스템 구현

[설계 및 구현] : 시스템 분석 및 설계 -> 시스템 구현

[시스템 테스트 및 운영] : 시스템 테스트 -> 시스템 운영 계획(지속적으로 활용하기 위해 교육 실시, 계획 수립)

 

5) 평가 및 전개

[모델 발전 계획 수림] : 모델 발전 계획(개발된 모델의 발전)

[프로젝트 평가 및 보고] : 프로젝트 성과 평가 -> 프로젝트 종료

 


3절. 분석 과제 발굴

1. 분석 과제 발굴 방법론

 

분석과제를 다양한 문제로 변환해서 분석 과제를 도.출. 해내 -> 도출하는 방법은 하향식 & 상향식 접근

*디자인사고 : 상향식 접근 방식의 발산 단계와 하향식 접근 방식의 수렴단계를 반복적 수행

 

2. 하향식 접근법 (Top Down Approach)

- 현황 분석을 통해 기회나 문제를 탐색(Problem Discovery) -> 해당 문제를 정의(Problem Definition)

-> 해결방안을 탐색(Solution Search)

-> 데이터 분석의 타당성 검토(Feasibility Study)

-> 분석 과제 도출

 

* 하향식 접근법의 데이터 분석 기회 단계

1단계 ) 문제 탐색 (Problem Discovery)

- 전체적인 관점의 기준 모델을 활용하여 빠짐없이 문제를 도출하고 식별하는 것이 중요하다.

- 전체적인 관점의 기준 모델로는 기업 외부 환경을 포괄하는 비즈니스 모델과 외부 참조 모델이 존재한다.

- 과제 발굴 단계에서는 세부적인 구현 및 솔루션에 초점 X / 문제를 해결함으로써 발생하는 가치에 중점을 두는 것 O

- 무엇을(What) 어떤 목적으로(Why) 수행해야 하는지에 대한 관점

 

2단계 ) 문제 정의 (Problem Definition)

- 식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의 하는 단계

- 필요한 데이터 및 기법(How)을 정의하기 위한 데이터 분석의 문제로의 변환을 수행

- 데이터 분석 문제의 정의 및 요구사항

: 분석을 수행하는 당사자뿐만 아니라 해당 문제가 해결되었을 때 효용을 얻을 수 있는 최종사용자(End User) 관점에서 이루어져야 한다.

- 문제 정의가 잘 되면 필요한 데이터의 정의 및 기법 발굴이 용이하기 때문에 가능한 정확하게 분석의 관점으로 문제를 재정의할 필요가 있다.

 

3단계 ) 해결방안 탐색(Solution Search)

- 정의된 데이터 분석 문제를 해결하기 위한 다양한 방안이 모색된다.

- 분석역량 : O & 분석 기법 및 시스템 : 기존 시스템 => 기존 시스템 개선 활용

- 분석역량 : X & 분석 기법 및 시스템 : 기존 시스템 => 교육 및 채용을 통한 역량 확보

- 분석역량 : O & 분서 기법 및 시스템 : 신규 도입 => 시스템 고도화

- 분석역량 : X & 분서 기법 및 시스템 : 신규 도입 => 전문업체

 

4단계 ) 타당성 검토(Feasibility Study)

- 1)경제적 타당성 : 비용 대비 편익 분석 관점의 접근 / 비용 : 데이터, 시스템, 인력, 유지보수 - 편익 : 경제적 가치(ex. 실질적 비용 절감, 추가적 매출과 수익)

-2) 데이터 타당성 : 데이터 존재 여부, 분석 시스템 환경, 분석역량

-3) 기술적 타당성 : 분석 역량 확보

 

* 문제 탐색 단계 中

** 비즈니스 모델 캔버스를 활용한 과제 발굴 방법 5가지 영역 : 업무, 제품, 고객, 규제와 감사, 지원 인프라

 

1) 업무(Operation) : 제품 및 서비스를 생산하기 위해서 운영하는 내부 프로세스 및 주요 자원(Resource) 관련 주제 도출

예) 생산 공정 최적화, 재고량 최소화

 

2) 제품(Product) : 생산 및 제공하는 제품 & 서비스를 개선하기 위한 관련 주제 도출

예) 제품의 주요기능 개선, 서비스 모니터링 지표도출

 

3) 고객(Customer) : 제품서비스를 제공받는 사용자 및 고객, 이를 제공하는 채널의 관점에서 관련 주제 도출

예) 고객 Call 대기 시간 최소화, 영업점 위치 최적화

 

4) 규제와 감사(Regulation& Audit) : 제품 생산 및 전달 과정 프로세스 중에서 발생하는 규제 및 보안의 관점에서 주제 도출

예) 제공 서비스 품질의 이상 징후 관리, 새로운 환경 규제 시 예상되는 제품 추출 등

 

5) 지원 인프라(IT&Human Resource) : 분석을 수행하는 시스템 영역 및 이를 운영 & 관리하는 인력의 관점에서 주제 도출

예) EDW(enterprise data warehouse) 최적화, 적정 운영 인력 도출 등

 

+) 새로운 유형의 분석 기회 및 주제 발굴 필요

 

** 분석 기회 발굴의 범위 확.장. 4가지 관점

1) 거시적 관점의 메가트랜트 : 조직 및 해당 산업에 폭넓게 영향을 미치는 사회경제적 요인 : STEEP

- 사회(Social), 기술(Technological), 경제(Economic), 환경(Environmental), 정치(Political)

 

2) 경쟁자 확대 관점 : 위협이 될 수 있는 상황에 대한 분석 기회 불굴의 폭을 넓혀서 탐색한다.

- 현재 직접 경쟁사 및 제품 서비스 + 대체재 신규 진입자 

 

3) 시장의 니즈 탐색 관점 :

- 직접적인 고객 + 고객과 접촉하는 채널(Channel): 상품 서비스를 전달하는 경로 + 구매와 의사결정에 영향을 미치는 영향자들(Influencer)

 

4) 역량의 재해석 관점 :

현재 보유한 역량 + 해당 조직의 비즈니스에 영향을 끼치는 파트너 네트워크

 

**외부참조 모델 기반 문제 탐색

: 유사&동종 사례 벤치마킹을 통해 산업별, 업무 서비스별 분석 테마후보에서 빠르게 도출

 

 

 

3. 상향식 접근법 (Bottom Up Approach)

- 기업이 보유하고 있는 다양한 원천 데이터로부터 분석을 통하여 통찰력과 지식을 얻는 접근 방법

- 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 모든 문제를 도출하는 일련의 과정

 

* 상향식 접근법의 특징

- 기존 하향식 접근방법(=논리적 단계별 접근법)은 문제 해결에 유효 :: Why 관점 <-> 상향식 접근법은 새로운 가치를 통해 문제 도출 ::WHat 관점

- 하향식 접근법은최근의 복잡하고 다양한 환경에서 발생하는 문제를 해결하기 어려움

 

=> 디자인적 사고(Design Thinking) 접근법을 통해 WHY -> WHAT 관점으로 존재하는 데이터 그 자체를 객관적으로 관찰하여 문제를 해결하려는 접근법을 사용

- 상향식 접근법은 비지도 학습 방법(Unsupervised Learning)으로 수행

- 비지도 학습은 데이터 자체의 결합, 연관성, 유사성을 중심으로 접근

- 시행착오를 통한 문제 해결, 프로토타이핑 접근법

*디자인사고 : 상향식 접근 방식의 발산 단계와 하향식 접근 방식의 수렴단계를 반복적 수행

 

* 비지도 학습(Unsupervised Learning)

- 일반적으로 상향식 접근법의 데이터 분석은 비지도 학습 방법에 의해 수행된다.

- 비지도 학습은 데이터 분석의 목적이 명확히 정의된 형태의 특정 필드의 값을 구하는 것이 아니라 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현하는 것이다.

- 비지도 학습의 데이터 마이닝 기법의 예 - 장바구니 분석, 군집 분석, 기술 통계 및 프로 파일링 

 

* 지도 학습(Supervised Learning)

- 명확한 목적 하에 데이터 분석을 실시하는 것은 지도 학습

- 분류, 추측, 예측, 최적화를 통해 사용자의 주도하에 분석을 실시하고 지식을 도출하는 것이 목적이다.

 

* 프로토타이핑 접근법

- 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해 보고 그 결과를 확인해 가면서 반복적으로 개선해 나가는 방법을 말한다.

- 하향식 접근방식은 정형화 & 완벽한 구조일 때 효과적 <-> 프로토타이핑 방법론은 비록 완전하지는 못하다 해도 신속하게 해결책이나 모형을 제시함으로써, 이를 바탕으로 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화할 수 있게 하는 유용한 상향식 접근 방식이다.

- 프로토타이핑 접근법의 기본적인 프로세스는 1)가설의 생성, 2)디자인에 대한 실험, 3)실제 환경에서의 테스트, 4)테스트 결과에서의 통찰도출 및 가설 확인으로 구성된다.

 

-프로토타이핑 접근법의 필요성 :

1) 문제에 대한 인식 수준 : 문제 정의가 불명확할 때 문제를 이해하고 구체화하기 위함.

2) 필요 데이터 존재 여부의 불확실성 : 데이터 집합이 존재하지 않을 때, 사용자와 분석가 간의 반복적이고 순환적인 협의 과정 필요

3) 데이터 사용 목적의 가변성 : 기존의 데이터에서 사용목적과 범위가 확대될 수 있음.

 

4. 분석과제 정의

 

- 분석 과제 정의서를 통해 분석별로 필요한 소스데이터, 분석방법, 데이터 입수 및 분석의 난이도, 수행주기, 검증 오너십 등을 정의한다.

-분석 데이터소스는 내외부의 비구조적인 데이터 & 소셜 미디어 및 오픈 데이터까지

 

 

4절. 분석 프로젝트 관리 방안

1. 분석 과제 관리를 위한 5가지 주요 영역(방법론 & 특징)

: 데이터 크기, 데이터 복잡성, 속도, 분석 복잡성, 정확도와 정밀도

 

1) 데이터 크기(Data Size)

- 하둡 환경에서의 엄청난 데이터양을 기반으로 분석하는 것과 기존 정형 데이터베이스에 있는 시간 당 생성되는 데이터를 분석할 때의 관리방식은 차이가 날 수 밖에 없다.

2) 데이터 복잡성(Data Complexity)

- BI(Business Intelligence) 프로젝트처럼 정형 데이터<-> 텍스트, 오디오, 비디오 등의 비정형 데이터  다양한 시스템에 산재되어 있는 원천 데이터들을 합해서 분석 프로젝트를 진행 할 때는, 초기 데이터의 확보와 통합 뿐 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요하다.

3) 속도(Speed)

- 분석결과가 도출되었을 때 이를 활용하는 시나리오 측면에서의 속도를 고려해야 한다. 일 단위, 주 단위 실적의 경우에는 배치(Batch)형태로 작업되어도 무방하지만 실시간으로 사기(Fraud)를 탐지하거나 고객에게 개인화된 상품〮서비스를 추천하는 경우에는 분석 모델의 적용 및 계산이 실시간으로 수행되어야하기 때문에 프로젝트 수행 시 분석 모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야한다.

4) 분석 복잡성(Analytic Complexity)

- 복잡할수록 정확도는 올라가지만 해석은 어려워짐.

- 분석 모델의 정확도와 복잡도는 트레이드오프(Trade off)관계가 존재한다. 분석 모델이 복잡할수록 정확도는 올라가지만 해석이 어려워지는 단점이 존재하므로 이에 대한 기준점을 사전에 정의해 두어야 한다. 고객의 신용을 평가하는 마케팅 시나리오에서 분석모델을 활용하여 신용점수가 낮게 나올 때 어떠한 변수에 기안했는지를 모델에서 설명해 줄 수 없으면 영업〮마케팅 직원 입장에서는 해당 고객과의 소통이 어려워지는 단점이 존재하므로, 해석이 가능하면서도 정확도를 올릴 수 있는 최적모델을 찾는 방안을 사전에 모색해야 한다.

5) 정확도와 정밀도 (Accuracy & Precision)

- Accuracy는 모델과 실제 값 사이의 차이가 적다는 정확도를 의미

- Precision은 모델을 지속적으로 반복했을 때의 편차의 수준으로써 일관적으로 동일한 결과를 제시한다는 것을 의미한다.

- 분석의 활용적인 측면에서는 Accuracy가 중요하며, 안정성 측면에서는 Precision이 중요하다. 그러나 Accuracy와 Precision은 트레이드오프가 되는 경우가 많기 때문에 모델의 해석 및 적용 시 사전에 고려해야 한다.

 

2. 분석 프로젝트의 특성

* 개요 :

- 데이터 영역과 결과를 활용할 비즈니스 영역의 중간에서 분석 모델을 통한 조율을 수행하는 조정자의 역할이 핵심.

- 지속적인 반복 및 정교화를 통해 재해석 o

 

3. 분석 프로젝트의 관리방안

* 항목:

1) 범위 : 분석 기획단계의 프로젝트 범위가 진행을 하면서 범위가 빈번히 바뀜.

2) 시간 : 초기에 의도했던 결과가 나오기 쉽지 않기 때문에 시간 소요 o . time boxing 기법

3) 원가

4) 품질 5) 통합/조달/자원/리스크/의사소통/이해관계자

 

'대외활동 > 자격증' 카테고리의 다른 글

[ADsP] 과목 3 - 정리  (0) 2023.03.22
[ADsP] 과목 2 - 2장 정리  (1) 2023.03.22