정의
|
- 기업의 내부 및 외부 데이터를 주제자향적을 통합한 데이터 집합체, 기업환경 변화에 대응하기 위한 의사결정 시스템의 기본 인프라
- 수년간의 기업의 운영계 시스템에서 발생한 내부 데이터와 외부 데이터를 주제별로 통합하여 별도의 프로그래밍 없이 즉시 여러 각도에서 분석할 수 있도록 하는 통합시스템
- 데이터 웨어하우징(Data Warehousing)은 데이터의 수집 및 처리에서 도출되는 정보의 활용에 이르는 일련의 프로세스
|
필요성
|
- 판매자 중심에서 구매자 중심으로 비즈니스 시장변화의 급속한 변화
- 신속하고 정확한 의사결정이 기업의 생존 직결됨
|
구조
|
- ODS : 운영 시스템 정보를 통합하기 위한 저장소
- ETL 및 CDC : Extraction, Transformation, Load 와 실시간 데이터 적재
- Metadata : 데이터 표준, 네이밍, 값, 범위, 제약사항, 원천데이터 정보
- 통합 ER모델 및 다차원 모델 : 주제지향 ER모델, Fact와 Dimemsion 구성
|
추진절차
|
- 주제 지향적 : 주제를 중심으로 데이터 구성. 의사결정에 필요 데이터 유지
- 통합적 : 속성이름, 자료표현, 계산단위 등 일관성이 있고 통합되어 있음
- 시계열 : 시간에 따른 순간 값을 유지하고 있음
- 비 휘발성 : 데이터 갱신은 초기 적재 이후에는 발생하지 않고 검색만 수행
|
구성요소
|
- ETT : 소스 데이터로부터 필요 데이터를 검색, 추출, 변환하여 목표 데이터 베이스 환경으로 전달하는 과정
- DOS(Operational Data Store) : 운영계 시스템별로 관리되는 데이터를 전시관점에서 통합 관리함으로써, 전사데이터 공유를 가능하게 하여주는 통합 데이터 베이스
- DM(Data Mart) : 의사결정 프로세스 지원을 목적으로 하는 부서별 또는 업무기능별 DW
- OLAP(OnLine Analyicla Processing) : EDW와 DM의 데이터를 사용자의 요건에 따라 다각적으로 분석하고 활용할 수 있도록 지원하는 도구
- 메타데이터 : 데이터의 사용성과 관리효율성 향상을 위한 데이터에 관한 데이터
|
활용방안
|
- BI 2.0과 함꼐 실시간 데이터를 처리하여 비즈니스 의사결정 적시성 향상
- 물리적 관점이 통합으로 TCO 절감
- Real time data 처리 수행
|
데이터 하우스의 구축절차
|
- 비즈니스 요구사항 정의 → 데이터 모델링 → 데이터소스 확인 및 식별 → 데이터 추출 변환 → 데이터웨어하우스 구축 → 사용자 교육
|
데이터 하우스 4가지 특징
|
- 주제지향적 : Data Warehouse는 의사 결정에 필요한 특정 주제(subject)의 데이터만을 가지며 그 외의 데이터는 포함하지 않음
- 통합 : Data Warehouse에 저장, 관리되는 데이터는 일반적으로 다수의 서로 다른 형태의 데이터베이스로부터 통합(integrated)된 것
- 비휘발성 : Data Warehouse의 데이터는 운영계 데이터 베이스로부터 로딩하고 액세스 하기 때문에 삭제 및 수정이 불가능 즉, 한 시점에서 다량의 Data가 적재되고 Access 되는 반면 갱신은 이루어 지지 않는 조회 전용 Database
- 시계열성 : Data Warehouse는 시간에 따라 변화된 데이터 정보를 통해 의사결정을 하기 때문에 일정기간 동안의 데이터를 저장하여 시점에 따른 분석을 가능하게 함
|