정보관리기술/인공지능

인공지능 파운데이션 모델

아이티신비 2024. 3. 15. 09:30

문제4) 인공지능 분야에서 파운데이션 모델의 개념, 특징, 기반기술 및 구현 시 법적·환경적·사회적 측면의 고려사항에 대하여 설명하시오.

답)

 

1. AI 민주화를 위한, AI 파운데이션 모델 개념 및 특징

가. AI 파운데이션 모델 개념

 
개념
대규모 데이터셋에 의해 사전 학습되고, 출력의 범용성을 고려하여 설계되어 다양한 작업에
적용될 수 있는 AI 기초 모델

 

나. AI 파운데이션 모델 특징

 
구분
특징
사례
학습
대규모 학습데이터
  • 제조사별 상이한 디바이스 연동 및 등록 절차
대규모 파라미터
  • 타 브랜드 디바이스 간 상호 연동 불가
확장성
전이학습
  • 다양한 통신프로토콜 혼합 사용에 따른 신뢰성 저하
균일화
  • 적용 될 수 있는 범위가 점차 확대되며 범용적 활용되는 현상
성능
창발성
  • 모델이 스스로 어떠한 문제를 해결하기 위한 지식 도출 능력
균일화
  • 적용 될 수 있는 범위가 점차 확대되며 범용적 활용되는 현상
  • 대규모 데이터셋 학습을 통해 다른 서비스나 분야로 사양도기 위한 다목적 모델

 

2. AI 파운데이션 모델의 개념도 및 기반기술

가. AI 파운데이션 모델의 개념도

 

  • 데이터로부터 traning 단계로 기반 모델을 학습하고 적용할 도메인 분야로 adaptation을 통해 최적화

 

 

나. AI 파운데이션 모델의 기반기술

구분
기반기술
설명
구현기술
대용량 학습데이터 구축
  • 자기지도학습을 사용하기 때문에 웹 크롤링 등의 방법을 사용해대규모 데이터를 구축하는 것이 중요
  • 데이터 거버넌스를 통해 데이터 전처리, 필터링이 필수요소
자기지도학습
  • 최소한의 데이터만으로 스스로 규칙을 찾아 분석하는 AI
트랜스포머 아키텍처
  • 포지셔널 인코딩을 통해 시퀀스 데이터를 병렬로 학습하고, 추론해 학습 연산량 감소를 가져와 대규모 데이터에 적합
컴퓨팅 성능
  • 매우 많은 파라미터 수(약 1조개)를 가진 파운데이션 모델을 학습을 위한 GPU, TPU등을 통해 연산 가속화가 필요
최적화
지식 증류
  • 이미 학습이 완료된 모델의“지식”을 다른 모델에 증류하여 전수
Pruning 모델구조 변경
  • 불필요한 파라미터 가중치를 0으로 만들어 용량을 줄이고 속도를 향상시키는 기법
양자화
  • 모델의 가중치 파라미터 값을 부동소수점이 아닌 정수로 매핑하는 방법을 사용해 GPU의 연산속도를 빠르게 하는 기법
Sparsity
  • 모델의 0이 아닌 값에 대해서만 수학적 연산을 수행함으로써 훈련 및 추론시간을 크게 향상시키는 기법
  • AI민주화를 위한 AI 파운데이션이란 개념이 도입됐지만, 자본력이 없이 CHAT-GPT같은 AI사업 어려운 실정

 

3. AI 파운데이션 모델 구현 시 고려사항

가. AI 파운데이션 모델 구현 시 법적, 환경적 측면 고려사항

 
구분
기반기술
설명
법적
측면
학습 데이터
개인정보 보호
  • 모델 학습에 사용되는 데이터에 개인정보 포함 시 데이터 수집,저장, 처리 및 보호하는데 관련 법률 및 규정 준수 필요
지식재산권 및
저작권
  • 모델 학습에 사용되는 데이터, 코드, 아키텍처에 대한 저작권 및 지식재산권 준수
데이터 사용 권한 및
이용 동의
  • 데이터를 수집하고 사용하기 위한 사용자 동의와 관련된 법적 요구사항 준수
안전 및
품질 규제
  • 의료, 자율주행 등 모델의 안전성과 성능에 대한 규정 준수 필요
환경적
측면
탄소 중립
  • 대규모 인공지능 모델 활용 시 배출하는 이산화탄소 배출 고려
자원 및 전력 효율성
  • 많은 컴퓨팅 자원을 요구하며 전력을 소모하는 대규모 인공지능모델 특성을 고려하여 전력 효율성 고려
친환경 데이터 센터
  • 데이터 세터 구축 시 그린 컴퓨팅 기술을 채택하여 에너지 소비와 온실 가스 배출 절감
데이터 선별 및 정제
  • 고급 훈련 데이터를 선별하여 더 적은 데이터로 학습을 통해 데이터 수집과 처리 과정 전력소모 감소로 환경 파괴 감소

 

나. AI 파운데이션 모델 구현 시 사회적, 기술적 측면 고려사항

 
구분
기반기술
설명
사회적
측면
일자리 감소
  • 일자리 감소로 어려움을 겪게될 노동자들을 위한 제도 마련AI 파운데이션 개발사의 환경적, 사회적, 거버넌스 측면 고려
공정성과 편향 방지
  • 모델 훈련 데이터와 결과를 검증하여 편향을 식별하고 공정성을 확보하는 노력 필요
설명가능한 AI
  • 인공지능이 도출하는 결과에 대해 설명하고 해석할 수 있는 도구와 기술을 도입하여 비즈니스 또는 의사결정 활용
안전 및 보안
  • 인공지능 적대적 공격에 대한 대비책 마련
기술적
측면
자기지도 학습
  • 데이터 라벨링 과정의 자동화를 통해 모델의 학습 단계에 들어가는 자원을 절감하고 인간의 편향 개입 방지
병렬 처리 및
분산 컴퓨팅
  • 대규모 모델을 효과적으로 처리하기 위해 병렬 처리 및 분산 컴퓨팅 기술을 도입하여 훈련 및 추론의 속도 향상
TPU, NPU, PIM
  • 인공지능 학습을 효율적으로 수행할 수 있는 인공지능 특화 HW활용
데이터 품질 관리
  • 파운데이션 모델의 성능과 정확성은 훈련 데이터의 품질에 크게 의존하기 때문에 학습 데이터에 대한 품질 관리 필요
  • AI민주화를 위한 AI 파운데이션이란 개념이 도입됐지만, 국내는 자본력이 부족하여 CHAT-GPT같은 AI사업 어려운 실정

 

4. 국내 AI파운데이션 모델 기술 발전을 위한 전략 제언

 
구분
핵심전략
설명
정부
측면
국가주도 AI 생태계 마련
국가주도를 통한 IT기업의 AI 생태계 생성 필요
규제샌드 박스 적용
제도적 지원을 통해 AI 기업 기술력 강화
기업
측면
GLEU, 벤치마크 데이터셋
AI 기술발전을 위해 공동으로 활용가능한 학습 데이터 제공
AI 파트너십
정부, 기업, 연구기관 간 협력과 파트너십을 통해 AI 기술
지식 확장
  • 국내 발 chat-GPT 등의 AI 플랫폼의 필요성이 커지고 있으므로 그에 맞는 다각적인 노력 필요
 

 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥