기술용어/데이터베이스

데이터웨어하우스(Data warehouse)

아이티신비 2024. 6. 11. 09:30

데이터웨어하우스

정의
  • 기업의 내부 및 외부 데이터를 주제자향적을 통합한 데이터 집합체, 기업환경 변화에 대응하기 위한 의사결정 시스템의 기본 인프라
  • 수년간의 기업의 운영계 시스템에서 발생한 내부 데이터와 외부 데이터를 주제별로 통합하여 별도의 프로그래밍 없이 즉시 여러 각도에서 분석할 수 있도록 하는 통합시스템
  • 데이터 웨어하우징(Data Warehousing)은 데이터의 수집 및 처리에서 도출되는 정보의 활용에 이르는 일련의 프로세스
필요성
  • 판매자 중심에서 구매자 중심으로 비즈니스 시장변화의 급속한 변화
  • 신속하고 정확한 의사결정이 기업의 생존 직결됨
구조
  • ODS : 운영 시스템 정보를 통합하기 위한 저장소
  • ETL 및 CDC : Extraction, Transformation, Load 와 실시간 데이터 적재
  • Metadata : 데이터 표준, 네이밍, 값, 범위, 제약사항, 원천데이터 정보
  • 통합 ER모델 및 다차원 모델 : 주제지향 ER모델, Fact와 Dimemsion 구성
추진절차
  • 주제 지향적 : 주제를 중심으로 데이터 구성. 의사결정에 필요 데이터 유지
  • 통합적 : 속성이름, 자료표현, 계산단위 등 일관성이 있고 통합되어 있음
  • 시계열 : 시간에 따른 순간 값을 유지하고 있음
  • 비 휘발성 : 데이터 갱신은 초기 적재 이후에는 발생하지 않고 검색만 수행
구성요소
  • ETT : 소스 데이터로부터 필요 데이터를 검색, 추출, 변환하여 목표 데이터 베이스 환경으로 전달하는 과정
  • DOS(Operational Data Store) : 운영계 시스템별로 관리되는 데이터를 전시관점에서 통합 관리함으로써, 전사데이터 공유를 가능하게 하여주는 통합 데이터 베이스
  • DM(Data Mart) : 의사결정 프로세스 지원을 목적으로 하는 부서별 또는 업무기능별 DW
  • OLAP(OnLine Analyicla Processing) : EDW와 DM의 데이터를 사용자의 요건에 따라 다각적으로 분석하고 활용할 수 있도록 지원하는 도구
  • 메타데이터 : 데이터의 사용성과 관리효율성 향상을 위한 데이터에 관한 데이터
활용방안
  • BI 2.0과 함꼐 실시간 데이터를 처리하여 비즈니스 의사결정 적시성 향상
  • 물리적 관점이 통합으로 TCO 절감
  • Real time data 처리 수행
데이터 하우스의 구축절차
  • 비즈니스 요구사항 정의 → 데이터 모델링 → 데이터소스 확인 및 식별 → 데이터 추출 변환 → 데이터웨어하우스 구축 → 사용자 교육
데이터 하우스
4가지 특징
  • 주제지향적 : Data Warehouse는 의사 결정에 필요한 특정 주제(subject)의 데이터만을 가지며 그 외의 데이터는 포함하지 않음
  • 통합 : Data Warehouse에 저장, 관리되는 데이터는 일반적으로 다수의 서로 다른 형태의 데이터베이스로부터 통합(integrated)된 것
  • 비휘발성 : Data Warehouse의 데이터는 운영계 데이터 베이스로부터 로딩하고 액세스 하기 때문에 삭제 및 수정이 불가능 즉, 한 시점에서 다량의 Data가 적재되고 Access 되는 반면 갱신은 이루어 지지 않는 조회 전용 Database
  • 시계열성 : Data Warehouse는 시간에 따라 변화된 데이터 정보를 통해 의사결정을 하기 때문에 일정기간 동안의 데이터를 저장하여 시점에 따른 분석을 가능하게 함


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

 

 

'기술용어 > 데이터베이스' 카테고리의 다른 글

반정규화(Denormalization)  (0) 2024.06.12
동시성제어(Concurrent Control)  (0) 2024.06.12
데이터베이스 성능 튜닝  (0) 2024.06.11
데이터베이스 보안  (0) 2024.06.10
데이터 마이닝(Data Mining)  (0) 2024.06.10