문제1) 데이터 마이닝 기법 중 아래 기법에 대하여 설명하시오.
가. K-means Clustering
나. DBSCAN(Density Based Spatial Clustering of Applications with Noise)
다. SVM(Support Vector Machine)
답)
1. 중심기반 군집화 K-평균 알고리즘(K-Means)
가. 중심기반 군집화 K-평균 알고리즘(K-Means)의 개념
정의
|
n개의 데이터를 K개의 군집으로 분류하기 위해 거리 기반으로 반복적으로 계산해 나가는
Clustering 알고리즘 |
개념도
|
![]() |
나. K-평균 알고리즘(K-Means)의 구성 요소와 절차
항목
|
세부 항목
|
설명
|
구성요소
|
K 값
|
클러스팅하여 묶을 클러스터의 개수
|
Centroid
|
클러스터링을 할 중심 값
|
|
수행절차
|
K 값 지정
|
파라미터 값으로 k개의 클러스터 개수를 지정
|
Centroid 지정
|
초기 평균값은 데이터 오브젝트
|
|
Centroid 거리 측정
|
각 데이터들은 거리측정을 통해 가장 가까운 Centroid 결정
|
|
데이터 그룹핑
|
최소 거리에 있는 Centroid 기준으로 그룹핑
|
|
Centroid 조정
|
k 개의 클러스터 중심점을 기준으로 Centroid 조정
|
|
종료
|
Centroid 가 더이상 변경되지 않는 경우 알고리즘 조정
|
|
|
다. K-평균 군집의 특징
특징
|
설명
|
비지도 학습
|
|
좌표 기반 분석
|
|
대용량 데이터 처리
|
|
다양한 데이터
특징 파악 유리 |
|
탐욕(Greedy)
알고리즘 |
|
장점
|
|
단점
|
|
|
2. 밀도기반 군집화 밀도기반 클러스터링(DBSCAN)
가. 밀도기반 군집화 밀도기반 클러스터링(DBSCAN) 개념
정의
|
임의의 클러스터 중심을 이동시키며 중심으로부터 정해진 반경 거리 내에 최소 데이터 포
인트 개수를 확인하며 밀도 기반으로 군집화를 수행하는 알고리즘 |
개념도
|
![]() |
나. 밀도기반 군집화 밀도기반 클러스터링(DBSCAN)의 구성 요소와 동작 방식
항목
|
세부항목
|
설명
|
구성요소
|
Core Point
|
|
Border Point
|
|
|
Connected
|
|
|
Noise Point
|
|
|
동작방식
|
① Epsilon 설정
|
|
② minPts 설정
|
|
|
③ Core point 분류
|
|
|
④ Border Point 분류
|
|
|
|
3. 여백을 최대화하는 통계적 분석 기법, SVM(Support Vector Machine)
가. SVM(Support Vector Machine)의 개념
![]() |
|
정의
|
|
목적
|
|
나. SVM의 구성요소 및 수행절차
구분
|
핵심기술
|
설명
|
구성요소
|
Support Vector
|
|
Margin
|
|
|
초평면
(hyperplane) |
![]() |
|
커널기법
(Kernel trick) |
![]() |
|
수행절차
|
데이터 전처리
|
|
변수 선택
|
|
|
통계적 분류
|
|
|
|
공감과 댓글은 아이티신비에게 큰 힘이 됩니다.
블로그 글이 유용하다면 블로그를 구독해주세요.♥
'정보관리기술 > 인공지능' 카테고리의 다른 글
인공지능 학습 / ① (24) | 2024.03.23 |
---|---|
음성데이터 마이닝 (23) | 2024.03.18 |
인공지능 윤리 (29) | 2024.03.17 |
인공지능(AI) 개인정보보호 자율점검표 (39) | 2024.03.16 |
인공지능 학습용 데이터 품질관리 가이드라인 (36) | 2024.03.16 |