정보관리기술/인공지능

SVM(Support Vector Machine)

아이티신비 2024. 3. 29. 09:00

문제10) SVM(Support Vector Machine)

 

답)

 

1. 여백을 최대화하는 통계적 분석 기법, SVM(Support Vector Machine)의 개요.

가. SVM(Support Vector Machine)의 정의

  • 데이터가 사상 된 공간에서 경계선과 가장 근접한 데이터(Support Vector)간의 거리가 가장 큰 경계를 식별하는 알고리즘(MMH: Maximum Margin Hyper plane)
  • 여백(Margin)을 최대화하여 일반화 능력의 극대화하여 결정직선을 찾는 두 범주를 갖는 객체들을 분류하는 방법

 

나. SVM(Support Vector Machine)의 목적

  • 주어진 많은 데이터들을 가능한 멀리 두 개의 집단으로 분리시키는 최적의 초평면(hyperplane) Training data에서 두 클래스의 어떤 Point로부터도 최대한 멀리 떨어져 있는 Decision boundary 확보

 

2. SVM의 개념도와 구성 요소

가. SVM의 개념도

 
  • 마진을 최대로 하는 분리 초평면을 구하여 데이터를 분류

 

 

나. SVM의 구성요소 및 수행절차

 
구분
핵심기술
설명
구성요소
Support Vector
  • 학습 데이터 중 분류 경계에 가장 가까운 곳에 위치한 데이터
Margin
  • 학습 데이터 중 분류 경계에 가장 가까운 데이터와 분류 경계 간 거리
초평면
(hyperplane)
커널기법
(Kernel trick)
수행절차
데이터 전처리
  • 데이터를 원하는 형태로 가공하는 과정
변수 선택
  • 중요한 변수(독립변수)를 찾는 과정
  • 너무 많은 독립변수는 정확도에 악영향
  • 적절한 변수 활용 통한 정확도, 계산속도, 모형 해석 능력 향상
통계적 분류
  • 종속변수 예측 및 종속변수에 영향을 미치는 독립변수를 찾는 과정
  • 기존 분류기는 오류율을 최소화하는 방법인 반면, SVM은 여백 Margin을 최대화하여 일반화 능력을 극대화

3. SVM의 활용 사례

 
사례
설명
텍스트, 이미지 분류
텍스트와 하이퍼텍스트, 이미지의 특성을 통한 분류, 학습데이터 축소
의료 정보 분류
분류된 화합물, 의약품에 대한 성분 확인
문자 인식
손글씨의 특징을 인지(필기체)
  • R에서는 LibSVM, SVM-Light 라이브러리 등을 이용하여 SVM의 활용이 가능

 

 


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

 

'정보관리기술 > 인공지능' 카테고리의 다른 글

SNN(Spiking Neural Network)  (28) 2024.03.30
과적합(Overfitting) / ①  (23) 2024.03.29
기계학습 모델링 vs 모델옵스 / ①  (24) 2024.03.28
IT-ROI 투자 성과평가 모델 / ①  (23) 2024.03.28
인공지능 딥뷰  (26) 2024.03.27