정보시스템 감리 기출해설/데이터베이스 해설

(제 23회) 데이터베이스 / (71)~(72) 해설

아이티신비 2024. 10. 4. 09:00

71. 다음은 정보 검색, 텍스트 마이닝에서 문서 집합과 용어에 대한 TFIDF의 개념을 설명한다. 만일, 문서 집합 D에 다음과 같이 d1, d2의 두 문서만 존재한다고 할 때, 용어 “this”에 대한 TFIDF 값이 옳은 것은?

 
 
- TF는 term frequency의 약어로, 해당 용어가 주어진 문서에 얼마나 많이 나타나는지를 나타낸다.
- IDF는 inverse document frequency의 약어로, 해당 용어가 문서 집합에 얼마나 많이 나타나는지에 대한 역수를 나타낸다.
- TFIDF는 문서 집합에서 특정 단어가 주어진 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다.

① TFIDF(“this”, d1, D) = 0,

TFIDF(“this”, d2, D) = 0

② TFIDF(“this”, d1, D) = 0.1,

TFIDF(“this”, d2, D) = 0.2

③ TFIDF(“this”, d1, D) = 0.3,

TFIDF(“this”, d2, D) = 0.3

④ TFIDF(“this”, d1, D) = 0.2,

TFIDF(“this”, d2, D) = 0.4

 

▣ 해설

따라서,

TF ('this', d1, D) = 문서집합 D로 부터 d1 문서에서 'this'의 빈도수 = 1

TF ('this', d2, D) = 문서집합 D로 부터 d1 문서에서 'this'의 빈도수 = 2

DF ('this', D) = 문서집합 D로 부터 'this' 가 등장한 문서의 수 = 2

 

n = 문서의 개수 = 2

TFIDF ("this", d1, 2) = TF × log (2/2) = TF × log(1) = 0

TFIDF ("this", d2, 2) = TF × log (2/2) = TF × log(1) = 0

 

정답 : ①

 

 

72. 다음 설명 중에서 NoSQL의 특징이나 장점과 가장 거리가 것은?

 

① NoSQL 시스템은 노드 추가를 통해 저장 공간과 처리능력을 증가시킬 수 있어 높은 확장성을 제공한다.

② NoSQL 시스템은 데이터를 여러 노드에 복제하여 저장함으로써 고장 허용(fault tolerance) 기능을 제공한다.

③ NoSQL 시스템은 파일 레코드에 대한 샤딩 (sharding)을 사용하여 부하분산을 이룬다.

④ NoSQL 시스템은 데이터를 여러 노드에 복제 저장 함으로써 읽기(조회)와 쓰기(갱신) 성능을 개선한다.

 

▣ 해설

④ NoSQL 시스템은 데이터를 여러 노드에 복제 저장 함으로써 읽기(조회)와 쓰기(갱신) 성능을 개선한다.

→ NoSQL 의 특징은 Consistency 를 포기하고, Availability 와 Partition Tolerance 를 강화하여, 읽기 성능을 개선했고, 쓰기 기능은 기존 RDBMS 에 비해 나빠졌음

 

 

정답 : ④

 





 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥