문제 2) 데이터 품질관리 프레임워크, 데이터 관리, 데이터 구조관리, 데이터 관리프로세스에 대하여 설명하시오.
정의
|
- 데이터 품질관리의 대상이 되는 구성요소와 요소들 간의 관계를 정의한 데이터 품질관리의 기본 개념틀
|
관리 목적
|
- 데이터 품질관리 요소는 크게 데이터 값(data value), 데이터 구조(data hierarchy), 데이터 관리 프로세스(data management process)로 구분
- 각 요소들은 상호 연계되어 정보시스템의 데이터 품질에 영향을 주고 있으므로 통합적이고 체계적인 관리 노력이 필요
|
프레임워크
|
- 데이터 품질관리 프레임워크는 관리 대상과 관리 조직을 기본축으로 한다.
|
관리항목
|
세부항목
|
설명
|
표준 데이터
|
정의
|
- 정보시스템에서 사용하는 용어, 도메인, 코드 및 기타 데이터 관련 요소에 대해 공통된 형식과 내용으로 정의하여 사용하는 표준 관련 데이터
|
관리목적
|
- 정보시스템의 데이터 품질 확보를 위한 필수 요소로, 표준 데이터를 정의·관리함으로써 데이터 간의 불일치와 데이터 오류를 방지하고 데이터에 대한 이해도 향상
- 기관이나 기업 전사 차원에서 단일하고 표준화된 정보시스템을 구현하게 함으로써 데이터 통합을 효율적으로 수행할 수 있도록 지원
|
세부관리
|
표준 단어 (word) 사전
|
- 기업이나 기관에서 업무상 사용되며 일정한 의미를 갖는최소 단위의 단어(word)를 정의한 사전
|
표준 도메인 (domain) 사전
|
|
표준 용어 (term) 사전
|
- 업무에서 빈번하게 사용되며 표준 단어를 조합해 정의한용어(term)
|
표준 코드
|
- 데이터 값을 정형화하기 위해, 정의된 기준에 따라 제한된 범위 내의 기호로 대치한 것을 의미
|
데이터 표준 요소
|
- 시스템을 설계하고 구축하는데 필요한 데이터 관련 요소에 대한 표준
|
모델 데이터
|
정의
|
|
관리 목적
|
- 데이터 모델에 대한 메타 데이터를 관리함으로써 데이터 구조에 대한 최신 정보를 유지하고 전사 차원의 데이터 모델 공유 및 재사용을 극대화하며, 체계적인 데이터 모델의 변경 관리를 가능하게 함
|
세부관리
|
- 관리 기준 : 완전성, 일관성, 추적성, 상호연계성, 최신성, 호환성 확보
- 관리 방법 : 데이터 구조와 구조를 표현하는 모델 데이터는 별개로 관리
|
관리 데이터
|
정의
|
- DB를 효과적으로 운영·관리하는데 필요한 데이터
|
관리 목적
|
- DB의 사용 및 성능 관리, 데이터 흐름 관리, 품질관리에 대한 데이터를 조직 내에서 정의한 목표 값을 기준으로 수시 혹은 정해진 기준 시간에 따라관리함으로써 DB를 효율적으로 운영·활용
|
세부관리
|
사용 관리 데 이터
|
- DB의 활용 가치와 사용자의 만족도를 극대화하기 위해필수적으로 관리되어야 할 데이터
|
장해 및 보안 관리 데이터
|
- DB의 정상적인 상태 유지나 효과적인 사용을 방해하는사건을 사전에 예방하거나 사건 발생시에 신속한 복구를위해 필요한 데이터
|
성능 관리 데 이터
|
- DB의 성능을 개선시키기 위해 필수적으로 관리해야 할데이터
|
흐름 관리 데 이터
|
- 하나의 정보시스템 데이터를 다른 정보시스템으로 이동할 때 사용하는 소스 데이터와 타깃 데이터 간의 매핑 정보를 관리하는 데이터
|
품질관리 데이터
|
- 데이터의 정합성을 확보하고 데이터 품질의 유지·개선 작업을 수행하기 위해 기본적으로 관리되어야 할 데이터
|
업무 데이터
|
정의
|
- 기관이나 기업의 업무 및 비즈니스를 수행하는데 필요한 데이터
|
관리 목적
|
- 정보시스템 정보의 근간인 데이터를 소스 데이터, 운영 데이터, 분석 데이터와 같이 각각의 특성에 따라 적절히 분할하여 관리함으로써 데이터 관리및 DB 구축 업무의 능률을 향상
|
세부관리
|
소스(source) 데이터
|
- 운영 업무 데이터의 소스가 되는 현실 세계의 데이터
|
운영 (operational) 데이터
|
- 기업이나 기관의 목표 달성 및 업무 수행을 위해 DB에서저장·관리하여 활용하는 데이터
|
분석(analysis) 데이터
|
- 운영 데이터의 추출(extraction), 변(transformation), 적재(loading)등의 과정을 통해 생성되는 데이터
|
관리항목
|
세부항목
|
설명
|
개념 데이터 모델
|
정의
|
- 업무 요건을 충족하는 데이터의 주제영역과 핵심 데이터 집합을 정의하고 상호 간의 관계를 정의한 모델
|
관리목적
|
- 건축물의 조감도와 같이 구축하고자 하는 업무 모델의 핵심 데이터 구조를그림으로써 전체 업무에 대한 큰 윤곽을 잡고 세부적인 단계로 나아갈 수 있게 한다.
|
세부관리
|
- 주제영역 : 업무상 친밀도가 높은 데이터 집합
- 핵심 엔티티 : 업무 영역 내에서 관리하고자 하는 데이터 집합
- 핵심 관계 : 핵심 엔티티 간의 논리적인 관계
|
데이터 참조 모델
|
정의
|
- 데이터 아키텍처의 구축·유지관리 및 조직에서 사용하고 있는 데이터 모델의 상호 운영과 타 조직 데이터모델의 참조·재사용을 목적으로 업무영역별,주제영역별로 표준 데이터 집합과 관리 항목들을 정의한 데이터 모델
|
관리목적
|
- 신규 데이터 모델링 시 사전에 기본 정보를 확보함으로써 전체 모델링에 소요되는 시간을 절약
- 새로운 데이터 모델링 시 데이터 참조 모델을 활용함으로써 정보의 누락을예방
|
세부관리
|
- 재사용이 가능한 형태의 데이터 모델로, 속성단위, 엔티티, ERD 전체 업무영역 단위 등이 데이터 참조 모델이 될 수 있다.
- 개념 데이터 모델, 논리 데이터 모델, 물리 데이터 모델도 데이터 참조 모델의 범위가 될 수 있다
|
논리 데이터 모델
|
정의
|
- 개념 데이터 모델을 상세화하여 논리적인 데이터 집합, 관리 항목, 관계를 정의한 모델
|
관리목적
|
- 전체 데이터 구조에서 가장 핵심을 이루는 모델로서 전체 업무 범위와 업무 구성 요소를 확인할 수 있다.
- 논리 데이터 모델 단계에서 데이터를 상세하게 정의·관리함으로써 불필요한데이터 중복과 데이터의 불일치를 방지할 수 있다.
|
세부관리
|
주제영역
|
- 업무상 친밀도가 높은 데이터 집합을 하나의 주제영역으로 선언하여 관리
|
엔티티
|
- 개념 데이터 모델의 정의를 포함하고 이력 관리와 동질성, 독립성 정보가 보다 더 상세히 파악된 서브 타입의 정보가 추가 가능
|
관계
|
- 개념 데이터 모델의 정의를 포함하고 상세 논리 데이터 모델 단계에서 모든 M:M 관계는 해소되어야 함
|
속성
|
- 속성은 엔티티 내에서 관리하고자 하는 정보 항목들을 의미
|
물리 데이터 모델
|
정의
|
- DBMS의 특성과 성능을 고려하여 논리 데이터 모델을 구체화시킨 모델
|
관리목적
|
- DBMS 선정 이후에 정의하며 해당 DBMS에서 최상의 성능을 보장하고 논리 데이터 모델에서 저장하는 데이터의 물리적 특성을 최대한 반영하여 설계·관리
|
세부관리
|
주제영역
|
- 논리적인 주제영역과 DBMS의 인스턴스 및 스키마와의 대응관계를 관리
|
테이블
|
- 테이블에 저장되는 데이터의 생명 주기와 일정기간 유지·관리해야 할 데이터의 건수 등의 설계 정보를 관리
|
관계
|
- 부모 테이블과 자식 테이블 간의 데이터 생성·삭제·변경 규칙
|
컬럼
|
- 표준화된 도메인 내에서 업무규칙이 반영된 데이터가 저장될 수 있도록 정의
|
정의
|
- 물리 모델을 구현한 결과물이며 구축된 실제 데이터가 저장되는 데이터 저장소
|
관리목적
|
- DB 저장소인 테이블과 접근 속도를 보장하기 위한 인덱스, 업무규칙이 반영된 제약 사항 및 기타 DB 관련 객체를 정의하여 관리함으로써 DB를 효과적으로 운영
|
세부관리
|
저장공간
|
- DB에서 테이블과 인덱스를 정의하는 영역(tablespace, data file)
|
테이블
|
|
제약조건
|
- Not Null, Default, Foreign Key Constraint, Check 조건 등의 업무 규칙은 컬럼에 정의할 것을 권장하나 테이블 간의 관계 적용제약 규칙은 애플리케이션과 병행하여 적용 가능
|
인덱스
|
- 논리 데이터 모델에는 반영되어 있지 않으나 데이터의 접근 속도를 빠르게 하기 위한 데이터 저장소의 하나
|
트리거
|
|
DB링크
|
- 원격지에 있는 DB를 연결하여 한 곳의 서버에서 다른 서버에 있는 데이터를 하나의 SQL문 내에서 다룰 수 있음
|
프로시져
|
- Function과 Procedure는 프로그램 SQL문으로 작성되며,SQL문으로 해당 Function과 Procedure를 호출하여 사용 가능
|
뷰
|
- 데이터를 보기 위하여 생성한 객체로 물리적인 저장 공간을 필요로 하지 않으며 사용자가 정의한 SQL문의 수행 결과를 보여주는 가상의 데이터 영역
|
동의어
|
|
롤
|
- DB 객체에 대한 생성, 삭제, 읽기, 변경 권한 규칙
|
사용자 View
|
정의
|
- 데이터를 제공하는 정보시스템 상의 화면이나 출력물
|
관리목적
|
- 화면, 출력물과 시스템의 구조적 관계를 정의해 관리하면 사용자 View의 개선·관리를 위해 필요한 데이터 모델이나 SQL 등에 대한 일련의 변경 작업을 신속하고 정확하게 수행 가능
|
세부관리
|
화면
|
- 정보시스템이 생성한 최종 산출물의 제공 인터페이스(최종 사용자화면, 시스템 관리자용 화면)
|
출력물
|
- 정보시스템이 생성한 최종 산출물의 제공 인터페이스(최종 사용자화면, 시스템 관리자용 화면)
|
번호
|
프로세스
|
주요절차
|
설명
|
1
|
데이터 품질기준 수립
|
DQI, CTQ 선정
|
- 데이터 품질 기준정보
- DQI 등 업무영역 선정
|
2
|
프로파일링
|
대상선정 프로파일링
|
- 일반적 유형 현황 파악
- 컬럼, 관계, 패턴, 코드 등
|
3
|
BR(Business Rule) 선정
|
BR 도출 및 확정
|
|
4
|
데이터품질진단
|
BR 측정 및 진단
|
- 확정 BR의 측정, 진단
- 결과에 따른 현상 분석
|
5
|
개선/정제
|
데이터 정제
|
|
공감과 댓글은 아이티신비에게 큰 힘이 됩니다.
블로그 글이 유용하다면 블로그를 구독해주세요.♥