정보관리기술/인공지능

데이터 차원 축소(Data Dimensionality Reduction)

아이티신비 2024. 3. 27. 09:00

문제5) 데이터 차원 축소(Data Dimensionality Reduction)

답)

 

 

1. 차원의 저주 해결, 데이터 차원 축소(Data Dimensionality Reduction)의 개요

가. 데이터 차원 축소(Data Dimensionality Reduction)의 정의

  • 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성

 

나. 데이터 차원 축소의 목적

직관적 분석
  • 다량의 차원을 2,3차원으로 변환하여 시각적으로 빠른 분석이 가능
차원의 저주 완화
  • 샘플의 특성이 너무 많으면 학습이 매우 어려워지지 않도록 함

 

2. 데이터 차원 축소 개념도 및 주요 유형

가. 데이터 차원 축소의 개념도

  • 데이터 차원 축소는 선형, 비선형 기법으로 나누어 사용할 수 있음

 

 

 

나. 데이터 차원 축소 주요 유형

 
구분
유형
내용
선형
PCA
  • 고차원 공간의 표본들을 연관성이 없는 저차원 공간(주성분)의표본으로 변환하는 알고리즘
LDA
  • 클래스간 분산과 클래스내 분산의 비율을 최대화하는 방식으로 데이터에 대한 특징 벡터의 차원을 축소하는 알고리즘
특이값 분해(SVD)
  • 임의의 m×n 차원의 행렬에 대해 행렬을 분해할 수 있다는 ‘행렬 분해(decomposition)’ 방법
요인 분석
  • 다수 변수들을 변수들 간의 관계를 분석하여 공통차원들을 통해 축약하는 통계 기법
비선형
ISOMAP
  • 다차원 스케일링(MDS) 또는 주성분 분석(PCA)의 확장 및 두 방법론을 결합한 알고리즘
로컬 선형 임베딩(LLE)
  • 고차원의 공간에서 인접해 있는 데이터들 사이의 선형적 구조를 보존하면서 저차원으로 임베딩하는 알고리즘
AutoEncoder
  • 입력이 들어왔을 때, 해당 입력 데이터를 최대한 compression 시킨 후, compressed data를 다시 본래의 입력 형태로 복원시키는 신경망
SOM(Self-Organizing Map)
  • 사람이 눈으로 볼 수 있는 저차원 격자에 고차원 데이터의 각 개체들이 대응하도록 인공신경망과 유사한 방식의 학습을 통해 군집을 도출해내는 기법

 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥