정보관리기술/데이터베이스

데이터 품질관리 지침

아이티신비 2024. 2. 12. 10:00

문제 2) 데이터 품질관리 프레임워크, 데이터 관리, 데이터 구조관리, 데이터 관리프로세스에 대하여 설명하시오.

답)

 

1. 데이터 품질관리 프레임워크 설명

 
정의
  • 데이터 품질관리의 대상이 되는 구성요소와 요소들 간의 관계를 정의한 데이터 품질관리의 기본 개념틀
관리 목적
  • 데이터 품질관리 요소는 크게 데이터 값(data value), 데이터 구조(data hierarchy), 데이터 관리 프로세스(data management process)로 구분
  • 각 요소들은 상호 연계되어 정보시스템의 데이터 품질에 영향을 주고 있으므로 통합적이고 체계적인 관리 노력이 필요
프레임워크
  • 데이터 품질관리 프레임워크는 관리 대상과 관리 조직을 기본축으로 한다.

 

2. 데이터 관리

관리항목
세부항목
설명
표준 데이터
정의
  • 정보시스템에서 사용하는 용어, 도메인, 코드 및 기타 데이터 관련 요소에 대해 공통된 형식과 내용으로 정의하여 사용하는 표준 관련 데이터
관리목적
  • 정보시스템의 데이터 품질 확보를 위한 필수 요소로, 표준 데이터를 정의·관리함으로써 데이터 간의 불일치와 데이터 오류를 방지하고 데이터에 대한 이해도 향상
  • 기관이나 기업 전사 차원에서 단일하고 표준화된 정보시스템을 구현하게 함으로써 데이터 통합을 효율적으로 수행할 수 있도록 지원
세부관리
표준 단어
(word) 사전
  • 기업이나 기관에서 업무상 사용되며 일정한 의미를 갖는최소 단위의 단어(word)를 정의한 사전
표준 도메인
(domain) 사전
  • 속성에 정의된 조건을 만족시키는 값의 범위
표준 용어
(term) 사전
  • 업무에서 빈번하게 사용되며 표준 단어를 조합해 정의한용어(term)
표준 코드
  • 데이터 값을 정형화하기 위해, 정의된 기준에 따라 제한된 범위 내의 기호로 대치한 것을 의미
데이터 표준
요소
  • 시스템을 설계하고 구축하는데 필요한 데이터 관련 요소에 대한 표준
모델 데이터
정의
  • 데이터 모델을 운용·관리하는데 필요한 데이터
관리 목적
  • 데이터 모델에 대한 메타 데이터를 관리함으로써 데이터 구조에 대한 최신 정보를 유지하고 전사 차원의 데이터 모델 공유 및 재사용을 극대화하며, 체계적인 데이터 모델의 변경 관리를 가능하게 함
세부관리
  • 관리 기준 : 완전성, 일관성, 추적성, 상호연계성, 최신성, 호환성 확보
  • 관리 방법 : 데이터 구조와 구조를 표현하는 모델 데이터는 별개로 관리
관리 데이터
정의
  • DB를 효과적으로 운영·관리하는데 필요한 데이터
관리 목적
  • DB의 사용 및 성능 관리, 데이터 흐름 관리, 품질관리에 대한 데이터를 조직 내에서 정의한 목표 값을 기준으로 수시 혹은 정해진 기준 시간에 따라관리함으로써 DB를 효율적으로 운영·활용
세부관리
사용 관리 데
이터
  • DB의 활용 가치와 사용자의 만족도를 극대화하기 위해필수적으로 관리되어야 할 데이터
장해 및 보안
관리 데이터
  • DB의 정상적인 상태 유지나 효과적인 사용을 방해하는사건을 사전에 예방하거나 사건 발생시에 신속한 복구를위해 필요한 데이터
성능 관리 데
이터
  • DB의 성능을 개선시키기 위해 필수적으로 관리해야 할데이터
흐름 관리 데
이터
  • 하나의 정보시스템 데이터를 다른 정보시스템으로 이동할 때 사용하는 소스 데이터와 타깃 데이터 간의 매핑 정보를 관리하는 데이터
품질관리 데이
  • 데이터의 정합성을 확보하고 데이터 품질의 유지·개선 작업을 수행하기 위해 기본적으로 관리되어야 할 데이터
업무 데이터
정의
  • 기관이나 기업의 업무 및 비즈니스를 수행하는데 필요한 데이터
관리 목적
  • 정보시스템 정보의 근간인 데이터를 소스 데이터, 운영 데이터, 분석 데이터와 같이 각각의 특성에 따라 적절히 분할하여 관리함으로써 데이터 관리및 DB 구축 업무의 능률을 향상
세부관리
소스(source)
데이터
  • 운영 업무 데이터의 소스가 되는 현실 세계의 데이터
운영
(operational)
데이터
  • 기업이나 기관의 목표 달성 및 업무 수행을 위해 DB에서저장·관리하여 활용하는 데이터
분석(analysis)
데이터
  • 운영 데이터의 추출(extraction), 변(transformation), 적재(loading)등의 과정을 통해 생성되는 데이터

 

 

 

3. 데이터 구조 관리

관리항목
세부항목
설명
개념 데이터 모델
정의
  • 업무 요건을 충족하는 데이터의 주제영역과 핵심 데이터 집합을 정의하고 상호 간의 관계를 정의한 모델
관리목적
  • 건축물의 조감도와 같이 구축하고자 하는 업무 모델의 핵심 데이터 구조를그림으로써 전체 업무에 대한 큰 윤곽을 잡고 세부적인 단계로 나아갈 수 있게 한다.
세부관리
  • 주제영역 : 업무상 친밀도가 높은 데이터 집합
  • 핵심 엔티티 : 업무 영역 내에서 관리하고자 하는 데이터 집합
  • 핵심 관계 : 핵심 엔티티 간의 논리적인 관계
데이터 참조 모델
정의
  • 데이터 아키텍처의 구축·유지관리 및 조직에서 사용하고 있는 데이터 모델의 상호 운영과 타 조직 데이터모델의 참조·재사용을 목적으로 업무영역별,주제영역별로 표준 데이터 집합과 관리 항목들을 정의한 데이터 모델
관리목적
  • 신규 데이터 모델링 시 사전에 기본 정보를 확보함으로써 전체 모델링에 소요되는 시간을 절약
  • 새로운 데이터 모델링 시 데이터 참조 모델을 활용함으로써 정보의 누락을예방
세부관리
  • 재사용이 가능한 형태의 데이터 모델로, 속성단위, 엔티티, ERD 전체 업무영역 단위 등이 데이터 참조 모델이 될 수 있다.
  • 개념 데이터 모델, 논리 데이터 모델, 물리 데이터 모델도 데이터 참조 모델의 범위가 될 수 있다
논리 데이터 모델
정의
  • 개념 데이터 모델을 상세화하여 논리적인 데이터 집합, 관리 항목, 관계를 정의한 모델
관리목적
  • 전체 데이터 구조에서 가장 핵심을 이루는 모델로서 전체 업무 범위와 업무 구성 요소를 확인할 수 있다.
  • 논리 데이터 모델 단계에서 데이터를 상세하게 정의·관리함으로써 불필요한데이터 중복과 데이터의 불일치를 방지할 수 있다.
세부관리
주제영역
  • 업무상 친밀도가 높은 데이터 집합을 하나의 주제영역으로 선언하여 관리
엔티티
  • 개념 데이터 모델의 정의를 포함하고 이력 관리와 동질성, 독립성 정보가 보다 더 상세히 파악된 서브 타입의 정보가 추가 가능
관계
  • 개념 데이터 모델의 정의를 포함하고 상세 논리 데이터 모델 단계에서 모든 M:M 관계는 해소되어야 함
속성
  • 속성은 엔티티 내에서 관리하고자 하는 정보 항목들을 의미
물리 데이터 모델
정의
  • DBMS의 특성과 성능을 고려하여 논리 데이터 모델을 구체화시킨 모델
관리목적
  • DBMS 선정 이후에 정의하며 해당 DBMS에서 최상의 성능을 보장하고 논리 데이터 모델에서 저장하는 데이터의 물리적 특성을 최대한 반영하여 설계·관리
세부관리
주제영역
  • 논리적인 주제영역과 DBMS의 인스턴스 및 스키마와의 대응관계를 관리
테이블
  • 테이블에 저장되는 데이터의 생명 주기와 일정기간 유지·관리해야 할 데이터의 건수 등의 설계 정보를 관리
관계
  • 부모 테이블과 자식 테이블 간의 데이터 생성·삭제·변경 규칙
컬럼
  • 표준화된 도메인 내에서 업무규칙이 반영된 데이터가 저장될 수 있도록 정의
정의
  • 물리 모델을 구현한 결과물이며 구축된 실제 데이터가 저장되는 데이터 저장소
관리목적
  • DB 저장소인 테이블과 접근 속도를 보장하기 위한 인덱스, 업무규칙이 반영된 제약 사항 및 기타 DB 관련 객체를 정의하여 관리함으로써 DB를 효과적으로 운영
세부관리
저장공간
  • DB에서 테이블과 인덱스를 정의하는 영역(tablespace, data file)
테이블
  • 엔티티와 속성이 테이블로 정의
제약조건
  • Not Null, Default, Foreign Key Constraint, Check 조건 등의 업무 규칙은 컬럼에 정의할 것을 권장하나 테이블 간의 관계 적용제약 규칙은 애플리케이션과 병행하여 적용 가능
인덱스
  • 논리 데이터 모델에는 반영되어 있지 않으나 데이터의 접근 속도를 빠르게 하기 위한 데이터 저장소의 하나
트리거
  • 테이블과 연계되어서 미리 규정된 함수를 수행
DB링크
  • 원격지에 있는 DB를 연결하여 한 곳의 서버에서 다른 서버에 있는 데이터를 하나의 SQL문 내에서 다룰 수 있음
프로시져
  • Function과 Procedure는 프로그램 SQL문으로 작성되며,SQL문으로 해당 Function과 Procedure를 호출하여 사용 가능
  • 데이터를 보기 위하여 생성한 객체로 물리적인 저장 공간을 필요로 하지 않으며 사용자가 정의한 SQL문의 수행 결과를 보여주는 가상의 데이터 영역
동의어
  • 테이블에 대한 별명
  • DB 객체에 대한 생성, 삭제, 읽기, 변경 권한 규칙
사용자 View
정의
  • 데이터를 제공하는 정보시스템 상의 화면이나 출력물
관리목적
  • 화면, 출력물과 시스템의 구조적 관계를 정의해 관리하면 사용자 View의 개선·관리를 위해 필요한 데이터 모델이나 SQL 등에 대한 일련의 변경 작업을 신속하고 정확하게 수행 가능
세부관리
화면
  • 정보시스템이 생성한 최종 산출물의 제공 인터페이스(최종 사용자화면, 시스템 관리자용 화면)
출력물
  • 정보시스템이 생성한 최종 산출물의 제공 인터페이스(최종 사용자화면, 시스템 관리자용 화면)

4. 데이터 관리 프로세스

 
번호
프로세스
주요절차
설명
1
데이터 품질기준 수립
DQI, CTQ 선정
  • 데이터 품질 기준정보
  • DQI 등 업무영역 선정
2
프로파일링
대상선정 프로파일링
  • 일반적 유형 현황 파악
  • 컬럼, 관계, 패턴, 코드 등
3
BR(Business Rule) 선정
BR 도출 및 확정
  • 각종 업무 규칙 수집
  • 측정 가능형태로 선정
4
데이터품질진단
BR 측정 및 진단
  • 확정 BR의 측정, 진단
  • 결과에 따른 현상 분석
5
개선/정제
데이터 정제
  • 저품질 BR 오류 분석
  • 개선/정제 후 재측정

 

 


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

'정보관리기술 > 데이터베이스' 카테고리의 다른 글

인공지능 학습용 데이터  (25) 2024.02.13
빅데이터분석도구를 선택하는 원칙 / ①  (0) 2024.02.12
DA와 DBA  (27) 2024.02.12
옵티마이저(Optimizer)  (25) 2024.02.11
샤딩(Sharding)  (23) 2024.02.11