728x90
반응형

기술용어/데이터베이스 15

데이터 마이닝(Data Mining)

효율적인 의사결정을 위한 유용한 정보의 추출, Data Mining정의대용량 데이터로부터 알려지지 않은 정보, 패턴을 찾아 의사결정에 활용하려는 데이터 분석 및 지식발견 프로세스대용량의 데이터 안에서 체계적인 통계적 규칙 이나 패턴을 탐색하고 이를 의미 있는 정보로 변환함으로써 기업의 의사결정에 적용하는 일련의 과정KDD(Knowledge discovery in database구조의사결정나무(Decision Tree) - 과거 레코드 분석으로 나무형태 패턴 모형신경망(Neural Network) - 세포를 모방한 개념, 반복적 학습연관성(Association) - 데이터 항목 간의 종속관계 분석, 강도, 방향분석군집(Clustering) - 유사한 특성을 지닌 데이터를 그룹화 시킴추진절차요구사항 분석 및..

OLAP(OnLine Analyical Processing)

정보에 직접 접근하여 대화식으로 정보분석/의사결정, OLAP정의최종 사용자가 다차원 정보에 중간 매개자나 매개체 없이 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정지식경영을 위해서 사용자가 대화식으로 유용한 데이터를 분석하여 의사결정에 활용할 수 있는 솔루션필요성대화식 분석 : 사용자가 시스템과 상호작용을 통해서 정보를 추출, 분석다차원 분석 : Fact 와 Dimension 으로 차원을 바꾸면서 분석구조관계형 데이터베이스 기반의 ROLAP 과 Array 기반의 다차원 모델 MOLAP, ROLAP와 MOLAP을 결합한 HOLAP, Desktop 기반의 DOLAP주요기능Pivol : 차원 테이블을 바꾸어 가면서 분석 수행Slicing & Dicing : 차원별 큐브를 수직, 수평..

MDM(Master Date Management)

다양한 관점의 흩어져 있는 데이터에 대한 통합 관리, MDM정의자주 변하지 않고 자료처리 운용에 기본 자료로 제공되는 자료의 집합으로 여러시스템에서 공통적으로 사용되는 정보비즈니스 트랜잭션의 표준 데이터 정보인 Master Data를 분산된 시스템들로부터 통합 및 공유하여 하나의 뷰를 제공하는 관리 방법등장배경데이터 관리 비효율 : 표준 프로세스 및 분류체계 부재, 정보의 품질 유지 난항데이터 무결성 위협 : 정보 변경절차의 표준 절차 부재로 데이터 신뢰성 저하데이터 관점 기준 부재 : 동일 정보에 대한 각 이해 관계자의 정보해석 관점 차이구조마스터 데이터 : 기업의 핵심자산으로 공유되며 비즈니스 특성을 규정트랜잭션 데이터 : 기업의 모든 활동 시에 발생하는 데이터주요기능데이터 통합 : 기업의 공통 데이..

K-means

각각의 군집 데이터 대표 값으로 전체 데이터 특성을 파악하는 클러스터 탐지 K-means정의전체 데이터를 몇 개의 집단으로 그룹화하여 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 분석법모집단 또는 범주에 대한 사전 정보가 없는 경우 주어진 관측 값들 사이의 거리 또는 유사성을 이용하는 분석법주어진 데이터들의 특성을 고려해 데이터 집단(클러스터)을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법군집화N개의 관찰치를 대상으로 p개의 변수를 측정했을 때 관측한 p개의 변수 값을 이용하여 N개의 관찰치 사이의 유사성 또는 비 유사성의 정도를 측정하여 관찰자를 가까운 순서대로 군집화 함활용군집분석은 속성이 비슷한 잠재 고객들끼리 그룹화 하여 시..

2PC(Phase Commit)

분산 데이터베이스 환경에서 원자성 보장, 2PC정의분산 데이터베이스 환경에서 분산 트랜잭션 발생 시에 원자성을 보장하기 위하여 모든 노드에 Commit 혹은 Rollback 되는 메커니즘필요성데이터 일관성 : 일부 지역 노드만 데이터를 갱신하는 일관성 위배 방지데이터 품질 : 지역 노드 간에 데이터 동기화를 통한 품질 확보구조Prepare 단계 : Golbal Coordinator 가 Commit Point Site 를 제외한 나머지 노드에게 Prepare 요청Commit 단계 : Coordinator 가 다른 Node 들로 부터 Ack 를 받았을 때 Commit 명령장점Commit 단계 수는 신뢰성과 정비례 하지만, 오버헤드와도 정비례 함분산 DB에서 데이터 일관성 및 신뢰성 유지특성여러 단계를 거칠수..

728x90
반응형