정보관리기술/데이터베이스

데이터 품질관리

아이티신비 2024. 2. 11. 09:00

문제 3) 데이터 품질관리에 대하여 다음을 설명하시오.

가. 데이터 품질관리 아키텍처

나. 데이터 품질관리 성숙도

다. 정형 데이터 및 비정형 데이터 품질기준

라. 데이터 품질관리 전략

 

답)

 

1. 데이터 품질관리 아키텍처

가. 데이터 품질관리 아키텍처의 정의

  • 데이터의 품질을 확보하기 위한 품질 목표 설정, 품질 진단 및 개선 등 일련의 활동과 이를 지원하기 위한 모든 기술

 

나. 데이터 품질관리 아키텍처의 개념도

 
  • 데이터 품질을 확보하기 위해 DQM3 및 데이터 거버넌스 적용 필요

 

2. 데이터 품질관리 성숙도

가. 데이터 품질관리 성숙도 모델의 개념

 
  • 데이터 품질관리 수준을 진단하고 개선 과제 및 방안을 단계적, 체계적으로 제시하기 위해 개발된 데이터 품질관리 프로세스의 성숙도 모델
데이터 품질기준
정확성, 일관성, 유용성, 접근성, 적시성, 보안성
데이터 품질관리 프로세스
요구사항관리, 데이터구조관리, 데이터흐름관리, 데이터베이스 관리, 데
이터 활용 관리, 데이터표준관리, 데이터 오너십 관리, 사용자 뷰 관리
품질관리 성숙수준
‘도입-정형화-통합화-정량화-최적화'의 5단계

 

나. 데이터 품질관리 성숙도의 세부 설명

 
① 도입
데이터 품질관리에 대해 문제점 및 필요성을 부분적으로 인지하고 시행하는 단계
② 정형화
데이터 품질관리를 위한 기반(프로세스, 솔루션 등)을 정형화 하는 단계
③ 통합화
전사적인 연계와 통합의 관점 하에 전사적으로 일관성 있는 데이터의 구조적 품질관리가 이루어지는 단계
④ 정량화
데이터 품질이 통계적 기법이나 정량적인 측정 방법을 통하여 관리되는 단계
⑤ 최적화
전사 관점에서 지속적인 개선사항을 도출/실행하며, 평가를 통해 사후관리를 수행하는 단계

 

3. 정형 데이터 및 비정형 데이터 품질 기준

가. 정형 데이터의 품질기준

 
품질기준
정의
완전성(Completeness)
  • 필수항목에 누락이 없어야 한다
유일성
(Uniqueness)
  • 데이터 항목은 유일해야 하며 종복되어서는 안된다
유효성
(Validity)
  • 데이터 항목은 정해진 데이터 유효범위 및 도메인을 충족해야 한다
일관성
(Consistency)
  • 데이터가 지켜야 할 구조, 값, 표현되는 형태가 일관되게 정의되고, 서로 일치해야 한다
정확성
(Accuracy)
  • 실세계에 존재하는 객체의 표현 값이 정확히 반영이 되어야 한다는 것을 의미한다.

 

나. 비정형 데이터의 품질기준

 
분류
품질기준
개념
  • 비정형 데이터는 메타데이터와 비정형 콘텐츠로 구분되며, 메타데이터는 정형 데이터와 유사 하지만, 비정형 콘텐츠는 추가적인 품질기준이 필요
동영상, 이미지, 사운드
  • 기능성, 신뢰성, 사용성, 효율성, 이식성을 기준으로 각각의 품질을 확인
  • 각 기준별 부특성으로는 적절성, 정확성, 상호운용성, 기능순응성, 성숙성, 신뢰 순응성, 이해성, 친밀성, 시간효율성, 자원효율성, 적응성, 공존성 등이 있음
GIS
  • 기능성에 대한 부특성(완전성, 해상도, 정확성, 일관성, 준수성)의 품질 확인

 

4. 데이터 품질관리 전략

가. 정보 생명주기 단계별 데이터 품질 관리 전략

 

 

나. 정보 생명주기 단계별 데이터 품질 관리 세부 전략

 
단계
전략
설명
계획
  • 조직 및 인력 확보
  • 데이터 품질 관리 위한 적정 조직 구성 및 인력 확보
  • 관리 대상 선정
  • 중점 품질 관리 필요 대상 데이터 베이스 선정
  • 진단/개선 계획 수립
  • 선정 중요 데이터 베이스에 대한 진단/개선 계획 수립
  • 표준화 방안
  • 정보의 공유, 연계를 통한 정보 공유성 확보
구축
  • 데이터 표준화
  • 표준화 대상, 범위, 일정, 예산, 추진 체계 등 확보
  • 데이터 구조의 일관성 확보
  • 데이터 중복 최소화 하도록 데이터 모델을 설계
  • 연계 데이터 정합성 관리
  • 공공 데이터 연계 사업 활성화에 따른 정합성 확인
  • 데이터베이스 구축 관련 산출물 관리
  • 체계적으로 작성된 산출물은 운영 단계의 데이터 품질 진단 및 개선 등의 품질관리 활동에 입력물로 활용
운영
  • 데이터 품질 진단 및 개선
  • 품질 진단 기준 지표 및 품질 진단·개선 도구 활용
  • 데이터 품질관리 관련 산출물 점검
  • 데이터 품질관리를 위한 관련 산출물 점검을 시행
  • 데이터 변경에 문서 최신성 확보
  • 미흡 산출물 대상으로 산출물 갱신 통한 산출물 관리
활용
  • 품질 오류 신고 접수 및 처리
  • 데이터를 이용하는 외부의 이해관계자로부터 품질 오류에 대한 신고를 접수
  • 품질 오류 조치 결과 통보
  • 접수 오류 내역에 대한 조치 진행 및 결과 요청자 통보
  • 품질 오류 현황 및 보고 관리
  • 품질 오류 내역 주기적 파악, 관리 위한 보고서 작성
  • 데이터 활용 성과 평가
  • 제공되는 데이터에 대한 활용도 평가 통한 개선안 도출


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

'정보관리기술 > 데이터베이스' 카테고리의 다른 글

옵티마이저(Optimizer)  (25) 2024.02.11
샤딩(Sharding)  (23) 2024.02.11
데이터베이스 튜닝  (24) 2024.02.10
CAP이론의 한계와 PACELC 이론 / ①  (0) 2024.02.10
Column Family 데이터베이스 / ①  (3) 2024.02.09