정의
|
- 데이터베이스 릴레이션이나 튜플을 데이터 손실과 중복없이 최소성, 일관성, 무결성을 확보하고 이상현상(Anomaly)를 제거하는 수학적 기법
- 관계형 데이터 모델에서 데이터의 중복성을 제거하여 이상 현상을 방지하고 데이터의 일관성과 정확성을 유지하기 위한 과정
- 속성(Attribute)들간의 종속성(Dependency)을 분석하여 기본적으로 하나의 종속 성이 하나의 릴레이션(Relation)으로 표현되도록 분해해 나가는 과정
- 이상 현상(Anomaly)을 야기하는 Attribute 간의 종속 관계를 제거하기 위해 Relation을 작은 Relation으로 무손실 분해하는 과정
|
구조
|
- 무손실 분해 : 하나 이상의 Relation 를 두 개 이상으로 분해 시에 무손실
- 종속성 유지 : 릴레이션 분해 후에도 종속성이 유지됨
|
필요성
|
- 중복의 제거로 저장 공간의 최소화
- 종속성 삭제로 일관성 및 무결성 보장
- 자료의 삽입, 갱신 및 삭제에 따른 이상현상(Anormaly) 제거
- 데이터 신규 발생시 DB 재구성의 필요성을 감소(유연한 구조)
- 연관관계 이용한 관리 및 이해 편리
|
정규화의 원칙
|
- 정보의 무손실 : 분해된 Relation이 표현하는 정보는 분해되기 전의 정보를 모두 포함하고 있어야 하며, 보다 더 바람직한 구조여야 함
- 데이터 중복성 감소 : 중복으로 인한 이상 현상의 제거
- 분리의 원칙 : 하나의 독립된 관계성은 하나의 독립된으로 분리하여 표현
|
추진절차
|
- INF : 데이터 모든 값이 원자값을 갖는 것
- 반복 및 중복제거, 2NF : 모든 속성 값이 키 값에 종속함, 부분함수 종속성 제거
- 3NF : 모든 속성 값이 키 값에 속하면서 속성 간의 종석송 제거(이행함수)
- BCNF(Boyce-code) : 제 2NF 이면서, 결정자 후보키제거
- 4NF : 다중 값 종속성 제고
- 5NF : 4NF 이면서 JOIN 종속성 제거
|
장점
|
- 최소의 데이터로 최적의 DB구축, 삽입, 갱신, 삭제 시 이상현상 제거, 중복 최소화로 공간 효율성 증대 및 유연성 확보
|
단점
|
- 빈번한 조인증가, 과도한 검색 조건문으로 성능저하, 이상현상 유발 및 모델의 유연성 저하발생
|
활용방안
|
- MDM : Master Data 에 대한 중복제거로 모델 독립성 확보
- Data Quality : DQMS에서 데이터 품질관리를 위한 모델 구성
- OLTP : 업무변화에 대응, 애플리케이션 영향도 최소화 시킴
|