정보시스템 감리 기출문제해설/데이터베이스 해설

(제 23회) 데이터베이스 / (73)~(75) 해설

아이티신비 2024. 10. 5. 09:00

73. 다음 표의 거래 정보에 대해서 최소지지도 (minsup)를 0.5로 하여 Apriori 알고리즘을 적용하고자 할 때, 빈발 2-항목집합(frequent 2-itemset) 모두를 옳게 나열한 것은?

① {A,B}, {A,E}, {B,E}

② {A,F}, {B,F}, {E,F}

③ {A,F}, {A,B}, {A,E}, {B,F}, {E,F}, {B,E}

④ {A,B}, {A,C}, {A,D}, {E,F}, {E,G}, {F,G}

▣ Apriori 알고리즘 상세

1) 수행절차

빈도수 집합 탐색 : 대용량 데이터 베이스 내의 단위 트랜잭션에서 빈번하게 발생하는 사건의 유형을 발견
최소 지지도 확인 : 트랜잭션을 대상으로 최소지지도 이상을 만족하는 빈발항목 집합을 발견
후보 집합 생성 : 빈발 항목으로 집합 생성
2~3단계 반복수행 : 새로운 빈발항목집합이 생성되지 않을 때까지 반복 수행
연관규칙 생성 : 발견된 항목 집합내에 포함된 항목들 중에서 최소신뢰도 이상을 만족하는 항목들 간의 연관규칙을 생성하는 단계

● Apriori 알고리즘 문제 풀이

1) 단일 항목 기준 지지도 계산 → 최소 지지도 구함(문제 주어짐, 원래는 아래처럼 계산)

→ P(A) = 7/10, P(B) = 5/10, P(C) = 4/10, P(D) = 4/10, P(E) = 7/10, P(F) = (5/10), P(G) = 2/10

2) 두개 항목 기준 지지도 계산 → 최소 지지도(0.5) 이상의 두개 항목 선정

P(A,B)	5/10	P(B,C)		P(C,D)	P(D,E)	P(E,F)	3/10	P(F,G)	0
P(A,C)	2/10	P(B,D)		P(C,E)	P(D,F)	P(E,G)	1/10
P(A,D)	2/10	P(B,E)	5/10	P(C,F)	P(D,G)
P(A,E)	5/10	P(B,F)	2/10	P(C,G)
P(A,F)	3/10	P(B,G)
P(A,G)
→ 최소 지지도 0.5보다 큰 두개 항목의 쌓은 {A,B},{A,E}.{B,E}

3) 3개 항목...4개항목...5개항목...6개항목...7개항목... → 최소지지도 이상인 쌍 구함

정답 : ①

74. 다음은 스팸(Spam) 메일을 인식하기 위해 구축한 예측모델로부터 얻어진 혼돈행렬(confusion matrix)이다.이 혼돈행렬로부터 구할 수 있는 성능척도 값이 옳지 않은 것은?

▣ 해설

분류성능평가지표	계산식	설명(사례)
정확도(Accuracy)	(TP+TN)/(TP+TN+FN+FP)	모델이 입력된 데이터에 대해 얼마나 정확하게 예측 비율
정확률(Precision)	TP/(TP+FP)	모델이 True라고 분류한 것 중에서 실제 True인 것의 비율
재현율(Recall)	TP/(TP+FN)	실제 True인 것 중에서 모델이 True라고 예측한 것의 비율
민감도(Sensitivity)	TP/T	질병이 있는 사람을 양성(질병이 있다고)으로 검출하는 능령
특이도(Specificity)	TN/N	질병이 없는 사람을 음성(질병이 없다고)으로 검출하는 능력
F-스코어	2{(정확률재현율)/(정확률+재현율)}	재현율과 정확률의 조화평균, 재현율 또는 정확율이 높다고 해서 성능이 높다고 할 수 없으므로 F-스코어를 계산하여 평가함

① 정밀도(precision) = 45/50 → 정확율 계산 = TP / (TP + FP) = 45 / (45+5) = 45 / 50

② 재현율(Recall) = 45/50 → 재현율 계산 = TP / (TP + FN) = 45 / (45+20) = 45 / 65

③ 특이도(Specificity) = ~~20/50~~ → 특이도 계산 = TN / N = 30 / 35

④ 정확도(Accuracy) = 75/100 → 정확도 계산 = (TP + TN) / (TP + TN + FN + FP) = 75 / 100

정답 : ③

75. 다음은 분산 데이터베이스에서의 투명성(transparency)에 대한 설명이다. 다음 투명성에 대한 설명 중 에서 가장 적절하지 않은 것은?

① 이름부여 투명성(naming transparency)은 분산 데이터베이스가 어떻게 설계되는지와 어느 사이트에서 트랜잭션이 실행되는지를 사용자에게 가려주는 것을 의미한다.

② 분산 투명성(distribution transparency) 또는 네트워크 투명성(network transparency)은 사용자에게 네트워크의 세부 사항과 분산 시스템 내에서 데이터 저장 장소의 위치를 가려주는 것을 의미한다.

③ 위치 투명성(location transparency)은 어떤 작업을 수행하기 위해 사용된 명령은 데이터의 위치와 명령이 입력된 시스템의 위치와 무관해야 함을 의미한다.

④ 중복 투명성(replication transparency)은 높은 가용성, 성능, 신뢰도를 위해 데이터 사본들이 여러 사이트에 중복될 수 있음을 의미하며, 중복된 사본의 존재를 사용자에게 가려준다.

▣ 해설

분산 데이터베이스의 투명도(단 위지중장병)

단편화 투명성 - 단편화 사본이 어디 사이트에 저장되어 있는지 몰라도
위치 투명성 - 저장소를 명시할 필요가 없음. 물리적 저장소를 몰라도(논리적 접근만 가능하다는 의미)
지역 투명성 - DB 사이의 Mapping 보장
중복 투명성 - 여러 사이트 중복, 알필요 없음
장애 투명성 - 장애와 무관, 트랜잭션의 원자성
병행 투명성 - 통시 수행 시 결과의 일관성 보장

이동 (migration) 투명성

이기종(Heterogeneity) 투명성

규모(Scale) 투명성

정답 : ①

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

'정보시스템 감리 기출문제해설 > 데이터베이스 해설' 카테고리의 다른 글

(제 22회) 데이터베이스 / (53)~(54) 해설 (1)	2024.11.24
(제 22회) 데이터베이스 / (51)~(52) 해설 (1)	2024.11.23
(제 23회) 데이터베이스 / (71)~(72) 해설 (0)	2024.10.04
(제 23회) 데이터베이스 / (69)~(70) 해설 (2)	2024.10.03
(제 23회) 데이터베이스 / (67)~(68) 해설 (0)	2024.10.02

현재글(제 23회) 데이터베이스 / (73)~(75) 해설

IT 기술의 모든 것

250x250

기출문제, 제15회, PMP, 전문가, 데이터베이스, 시스템구조, 소프트웨어공학, 인증, ISP, 감리 및 사업관리, 제24회, 정보시스템감리사, 트래픽, 제16회, PMI, 제14회, PMBOK, PMO, ISMP, 보안,

Today :
Yesterday :

IT신비

(제 23회) 데이터베이스 / (73)~(75) 해설

'정보시스템 감리 기출문제해설 > 데이터베이스 해설' 카테고리의 다른 글

'정보시스템 감리 기출문제해설/데이터베이스 해설'의 다른글

티스토리툴바

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

(제 23회) 데이터베이스 / (73)~(75) 해설

'정보시스템 감리 기출문제해설 > 데이터베이스 해설' 카테고리의 다른 글

'정보시스템 감리 기출문제해설/데이터베이스 해설'의 다른글

관련글

티스토리툴바