728x90
반응형

정보관리기술/데이터베이스 39

데이터 관리 / ②

문제 3) A기업에서는 비지니스 수행과정에서 수집된 많은 양의 빅데이터(Bigdata)를 통합 관리하고자 한다. 데이터 관리에 대한 아래의 사항을 설명하시오. 가. 데이터 거버넌스(Data Governance)의 개념 및 주요 기능 나. 마스터 데이터(Master Data)의 개념과 필요성 다. 마스터 데이터 관리(Master Data Management)의 구성요소와 구축 시 고려사항 답) 1. 데이터 거버넌스(Data Governance)의 개념 및 주요 기능 가. 데이터 거버넌스(Data Governance)의 개념 전사 차원의 모든 데이터에 대한 정책, 지침, 표준화, 전략을 수립하고 데이터를 관리하는 조직과 프로세스를 구축함으로써 고품질의 데이터를 활용하여 기업의 가치 창출을 지원하는 체계 데이..

데이터 거버넌스(Data Governance) / ①

문제 4) 데이터 거버넌스(Data Governance) 답) 1. 기업 데이터 관리 지침, 데이터 거버넌스(Data Governance)의 개요 정의 전사 차원의 모든 데이터에 대한 정책, 지침, 표준화, 전략을 수립하고 데이터를 관리하는 조직과 프로세스를 구축함으로써 고품질의 데이터를 활용하여 기업의가치 창출을 지원하는 체계 2. 데이터 거버넌스(Data Governance) 프레임워크(Framework)와 주요 기능 가. 데이터 거버넌스(Data Governance) 프레임워크(Framework)와 구성 요소 구성요소 설명 원칙(Principle) 데이터를 유지, 관리하기 위한 지침과 가이드 보안, 품질 기준, 변경 관리 조직(Organization) 데이터를 관리할 조직의 역할과 책임 데이터 관리..

텐서플로(TensorFlow) / ①

문제 6) 텐서플로(TensorFlow) 답) 1.구글의 인공지능 플랫폼 라이브러리라이브러리, TensorFlow 개념 가. TensorFlow 정의 머신러닝 모델의 손쉬운 제작과 빌드 및 배포를 위해 구글에서 만든 엔드 투 엔드 오픈소스 플랫폼 나. TensorFlow 특징 직관적 API 케라스 , 파이썬파이썬, C++ API 이외 Backward Compatible 지원 이중 모드 CPU , GPU 모드별로 ML 연산과 단순작업 분할 TPU 텐서플로우 전용 최적화 칩셋 활용 2. TensorFlow Architecture 및 구성요소 가. TensorFlow Architecture (2.0 기준기준) 간소화된 API 기반으로 케라스케라스(Keras)와 에거엑스큐션에거엑스큐션(eager executio..

군집분석(Cluster Analysis) / ①

문제 5) 군집분석(Cluster Analysis) 답) 1. 개체집합 내 유사성 분석, 군집분석의 개요 가. 군집분석(Cluster Analysis)의 개념 개념도 정의 군집내 객체간 유사성과 군집간 상이성상이성(이질성이질성)을 규명하기 위해 관측치 또는 개체를 의미 있는 몇 개의 부분 집단으로 나누는 비지도 학습 기반의 분석기법분석기법 군집분석이란 비슷한 내용을 묶고 다른 내용과는 멀리하는 것 나. 군집분석(Cluster Analysis) 의 특징 탐색적 주어진 자료의 사전정보 없이 의미 있는 자료구조 탐색 데이터 거리가 정의된 다양한 형태의 데이터에 적용 가능 유사도 물리적 거리가 가까운 항목들은 동일 집단으로 묶임 비지도학습 기반으로기반으로, 유사도 측정을 통하여 군집을 형성함형성함 2. 군집분석..

데이터 시각화(Data Visualization)

문제 2) 데이터 시각화(Data Visualization)와 관련하여 다음을 설명하시오. 가. 데이터 시각화의 개요 나. 데이터 시각화의 원리 및 절차 다. 데이터 시각화 유형 라. 효과적인 데이터 시각화를 위한 효율화 방안 답) 1. 데이터 시각화의 개요 정의 정보의 목적에 부합하는 효과적인 전달을 위해 수집된 정보를 재조직하고, 시각화하여 정보전달효과를 극대화하는 프로세스 데이터 분석 결과를 한눈에 알아볼 수 있도록 데이터 시각화 원리 및 절차를 준수해야 함 2. 데이터 시각화의 원리 및 절차 가. 데이터 시각화의 원리 원칙 설명 Abstraction - Figuration 실제의 물체와 같은 것들일 수록 형상에 가깝고, 차트나 박스와 같이 단순화한 표현들은 추상에 가까움 Functionality ..

오피니언 마이닝(Opinion Mining)

문제 11) 오피니언 마이닝마이닝(Opinion Mining) 답) 1. 온라인 소셜 데이터 분석을 위한 오피니언 마이닝의 정의 웹콘텐츠의 텍스트에 나타난 사람들의 의견이나 성향 등의 주관적인 데이터를 분석하는 자연어 처리 기술 2. 감정분석을 위한 오피니언 마이닝 시스템 구성도 및 기술 요소 가. 오피니언 마이닝 시스템 구성도 웹크롤링, 머신러닝 분류기분류기, Word2Vec 등의 기술을 활용한 결과를 시각화 제공 나. 오피니언 마이닝 기술 요소 분류 기술요소 내용 추출/수집 Web Crawling 웹 텍스트 자동 수집 과정 용이 주관성 탐지 감성과 관련없는 부분 제외 Opinion Mining 알고리즘 ML분류기(나이브 베이지안, SVM), Word2Vec 단어 극성분석 단어들의 긍정적/부정적 표현 ..

웹 크롤링(Web Crawling)

문제1) 웹 크롤링(Web Crawling)에 대하여 설명하시오. 답) 1. 웹 컨텐츠 수집 자동화, 웹크롤링의 개요 가. 웹크롤링(Web Crawling)의 개념 웹 크롤링 흐름도 웹 크롤링의 개념 웹 크롤러를 이용해 월드 와이드 웹을 탐색하여 원하는 정보를 얻어 내거나 기억시킨 동작을 하는 컴퓨터 프로그램 웹 페이지 크롤링을 통해 직접 접근해 정보를 빠르게 수집하거나 자동 이메일 수집 또는 웹 유지관리를 위해 사용 모든 URL을 탐색하여 우선순위별로 다운로드를 반복수행하고, DB에 저장 후 크롤링 종료 나. 웹 크롤링(Web Crawling)의 동작원리 동작원리 설명 HTML 파싱 HTML 페이지를 가져와서, HTML/CSS등을 파싱하고, 데이터 추출 Open API 호출 Open API(Rest A..

데이터 거버넌스

문제 1) 코로나-19(Covid-19)로 인한 언택트 시대의 데이터 주권 이슈와 데이터 거버넌스 전략 방향에 대하여설명하시오. 답) 1. 코로나-19 시대 데이터 주권 확립을 위한 데이터 거버넌스 전략의 필요성 필요성 코로나19의 영향이 장기화되면서 언택트 문화가 일상화 되고 있고 데이터 자원의 폭발적 증가를 의미하며 데이터 확보를 위한 데이터 주권 확보 차원으로 진화되고 있고 확립 차원에서 데이터 거버넌스 전략이 필요 데이터 주권이란 데이터가 수집된 국가 내의 법률 및 거버넌스 구조에 종속되는 것으로 언택트 시대에 이슈로 부각 되는 중 2. 코로나-19로 인한 언택트 시대의 데이터 주권 이슈 이슈 설명 데이터 이동 국경간 데이터 이동과 글로벌 데이터 기업의 조세 형평성 등 데이터를 매개로 한 국가간 ..

인공지능 학습용 데이터

문제 6) 디지털 뉴딜 데이터 댐 의 핵심인 인공지능 학습용 빅데이터 구축 사업의 성공적 추진을 위한 정책과 데이터 품질에 대한 관심도가 높아지고 있다 . 다음의 내용을 설명하시오 가. 인공지능 학습용 데이터의 특성 나. 데이터 획득·정제 방법과 기준 다. 데이터 라벨링 (Data Labeling) 및 어노테이션 (Annotation) 방식 답) 1. 인공지능 학습용 데이터의 특징 구분 설명 정의 머신러닝 , 딥러닝 등 AI 모델 학습을 위해 활용되는 데이터를 총칭 지도학습에 활용되는 라벨링 된 데이터 구성 원천(원본 ) 데이터 원시데이터를 라벨링 공정에 투입하기 위해 필요한 전처리 등 정제 작업을 수행 한 데이터로 라벨링데이터가 부여되지 않은 상태의 데이터 라벨링 데이터 원천데이터에 부여한 참값 ’, ..

빅데이터분석도구를 선택하는 원칙 / ①

문제 5) 빅데이터 분석도구를 선택하는 원칙 답) 1. 데이터활용 명확한 정보제공, 빅데이터 분석도구의 정의 대량의 데이터들의 분석을 통해 가치있고 활용성이 높은 정보를 얻을 수 있도록 도와주는 도구 2. 빅데이터 분석도구를 선택하는 원칙 설명 가. 조직관점 종합적 선택 원칙 원칙 세부항목 설명 품질 기능성 빅데이터의 처리 분석 시각화 기능 성능 다양한 유형 방대한 양의 데이터 처리 속도 보안성 데이터 침해 프리이버시 침해 사용성 학습성 Learning Cost 측정 편의성 사용자인터페이스 모델링 용이성 목표달성도 다양한 모델 구축 가능여부 벤더 벤더 명성 벤더의 업력 자본금 재무상태 등 컨설팅 능력 최근 구축 사이트 레퍼런스 유지관리 유지관리서비스 등급별 비용 E o S 기간 고려 결과물 이해성 결과물..

728x90
반응형