71. 다음은 정보 검색, 텍스트 마이닝에서 문서 집합과 용어에 대한 TFIDF의 개념을 설명한다. 만일, 문서 집합 D에 다음과 같이 d1, d2의 두 문서만 존재한다고 할 때, 용어 “this”에 대한 TFIDF 값이 옳은 것은?
- TF는 term frequency의 약어로, 해당 용어가 주어진 문서에 얼마나 많이 나타나는지를 나타낸다.
- IDF는 inverse document frequency의 약어로, 해당 용어가 문서 집합에 얼마나 많이 나타나는지에 대한 역수를 나타낸다. - TFIDF는 문서 집합에서 특정 단어가 주어진 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다. |
|
① TFIDF(“this”, d1, D) = 0,
TFIDF(“this”, d2, D) = 0
② TFIDF(“this”, d1, D) = 0.1,
TFIDF(“this”, d2, D) = 0.2
③ TFIDF(“this”, d1, D) = 0.3,
TFIDF(“this”, d2, D) = 0.3
④ TFIDF(“this”, d1, D) = 0.2,
TFIDF(“this”, d2, D) = 0.4
▣ 해설
따라서,
TF ('this', d1, D) = 문서집합 D로 부터 d1 문서에서 'this'의 빈도수 = 1
TF ('this', d2, D) = 문서집합 D로 부터 d1 문서에서 'this'의 빈도수 = 2
DF ('this', D) = 문서집합 D로 부터 'this' 가 등장한 문서의 수 = 2
n = 문서의 개수 = 2
TFIDF ("this", d1, 2) = TF × log (2/2) = TF × log(1) = 0
TFIDF ("this", d2, 2) = TF × log (2/2) = TF × log(1) = 0
정답 : ①
72. 다음 설명 중에서 NoSQL의 특징이나 장점과 가장 거리가 먼 것은?
① NoSQL 시스템은 노드 추가를 통해 저장 공간과 처리능력을 증가시킬 수 있어 높은 확장성을 제공한다.
② NoSQL 시스템은 데이터를 여러 노드에 복제하여 저장함으로써 고장 허용(fault tolerance) 기능을 제공한다.
③ NoSQL 시스템은 파일 레코드에 대한 샤딩 (sharding)을 사용하여 부하분산을 이룬다.
④ NoSQL 시스템은 데이터를 여러 노드에 복제 저장 함으로써 읽기(조회)와 쓰기(갱신) 성능을 개선한다.
▣ 해설
④ NoSQL 시스템은 데이터를 여러 노드에 복제 저장 함으로써 읽기(조회)와 쓰기(갱신) 성능을 개선한다.
→ NoSQL 의 특징은 Consistency 를 포기하고, Availability 와 Partition Tolerance 를 강화하여, 읽기 성능을 개선했고, 쓰기 기능은 기존 RDBMS 에 비해 나빠졌음
정답 : ④
공감과 댓글은 아이티신비에게 큰 힘이 됩니다.
블로그 글이 유용하다면 블로그를 구독해주세요.♥
'정보시스템 감리 기출해설 > 데이터베이스 해설' 카테고리의 다른 글
(제 22회) 데이터베이스 / (51)~(52) 해설 (1) | 2024.11.23 |
---|---|
(제 23회) 데이터베이스 / (73)~(75) 해설 (0) | 2024.10.05 |
(제 23회) 데이터베이스 / (69)~(70) 해설 (2) | 2024.10.03 |
(제 23회) 데이터베이스 / (67)~(68) 해설 (0) | 2024.10.02 |
(제 23회) 데이터베이스 / (65)~(66) 해설 (1) | 2024.10.01 |