문제1) 음성데이터 마이닝의 정의, 목적, 주요 기술, 활용 가능 분야, 발전 방향에 대하여 기술하시오.
답)
1. 음성데이터 마이닝의 정의와 목적
정의
|
|
|
구성도
|
|
|
목적
|
빅데이터 중 비정형 데이
터 규모(volume) 증가 |
|
대용량 실시간(velocity) 데
이터 증가 |
|
|
다양한(variety) 비정형 유
형 증가 |
|
|
|
2. 음성데이터 마이닝의 주요 기술
가. 음성인식(Speech To Text) 측면의 주요 기술
구분
|
항목
|
설명
|
요소기술
|
EPD
(End-Point Detection) |
음성신호만의 고유한 특성을 처리하기 위해서, 발화 음성의 시작과 끝을
자동으로 검출하는 끝점검출 기술 |
전처리 기술
|
음성신호의 주파수 특성을 잡음환경에서도 뚜렷하게 분석 추출하는 기술
|
|
후처리 기술
|
숫자나 영문, 문장부호를 복원하는 기술
|
|
인식모델
|
음향모델
|
화자의 음성이 어떤 소리인지 분별 능력을 학습하는 모델
|
발음사전
|
단어의 다양한 발음패턴을 기억하는 사전
|
|
언어모델
|
단어 간의 관계 또는 문법을 학습하는 모델
|
나. 비정형데이터인 음성데이터의 텍스트 마이닝(Text Mining) 주요 기술
주요기술
|
설명
|
데이터 수집
|
뉴스/동영상 공유 플랫폼/콜센테 음성녹취파일/블로그 등 음성 데이터 수집
|
데이터 전처리
|
컴퓨터 이해하기 쉽게 텍스트를 변환하는 과정
(오탈자 제거, 불용어 제거, 정제, 정규화) |
토근화
|
단어 단위로 나누는 과정으로 형태소 분석기 사용
(주어진 말뭉치에서 토큰이라는 단위로 나누는 작업) |
특징값 추출
|
중요한 단어를 선별하는 과정
|
데이터 분석
|
데이터 마이닝, 머신러닝, 딥러닝 등 분석 모델 이용
(회귀분석, 랜덤포레스트, 선형분석, XGBoost, RNN, GRU 등) |
3. 음성데이터 마이닝의 활용 가능 분야
분야
|
설명
|
범죄 예방
|
음성데이터를 이용하여 보안과 안전 강화를 목적으로 사람들을 감시
|
콘텐츠 분석
|
콘텐츠 내 음성데이터를 이용하여 분류
|
건강 모니터링
|
병원에 있는 환자의 건강 상태를 감지, 유아의 호흡 문제 감지
|
인구 통계 정보
|
성별, 나이, 감정과 감정, 언어 등을 포함하여 분류
|
고객의 의견
|
제품 및 서비스에 대한 고객의 정확하고 정확한 의미를 해석하는 데 도움
|
4. 음성데이터 마이닝의 발전 방향
구분
|
항목
|
설명
|
기술
동향 |
종단형
음성인식 |
|
비지도 학습
|
|
|
다국어
음성인식 |
|
|
국내외 산업계
현황 |
인공지능
스피커 대중화 |
|
개발플랫폼
지원 및 생태계 구축 |
|
|
가정 내 AI
허브 전략 |
|
공감과 댓글은 아이티신비에게 큰 힘이 됩니다.
블로그 글이 유용하다면 블로그를 구독해주세요.♥
'정보관리기술 > 인공지능' 카테고리의 다른 글
머신러닝(Machin Learning)과 딥러닝(Deep Learning) /① (22) | 2024.03.23 |
---|---|
인공지능 학습 / ① (24) | 2024.03.23 |
데이터 마이닝(Data Mining) (28) | 2024.03.17 |
인공지능 윤리 (29) | 2024.03.17 |
인공지능(AI) 개인정보보호 자율점검표 (39) | 2024.03.16 |