정보시스템 감리 기출해설/데이터베이스 해설

(제 25회) 데이터베이스 / (71)~(72) 해설

아이티신비 2025. 2. 4. 09:00

71. 다음 확장성 해시(extendible hash) 파일에서 전역 깊이(global depth)를 (가)로 나타내고 지역 깊이(local depth)를 (나)로 나타낸다고 할 때, 모조키가 000010인 레코드가 삽입된 후, 변경된 확장성 해시 파일에 대해 전역 깊이(가)와 모든 버킷의 지역 깊이(나)의 합을 각각 옳게 나열한 것은?

 

(단, 한 버킷에는 최대 4개의 레코드가 포함된다.)

① 전역 깊이 3, 지역 깊이의 합 11

② 전역 깊이 4, 지역 깊이의 합 11

③ 전역 깊이 3, 지역 깊이의 합 14

④ 전역 깊이 4, 지역 깊이의 합 14

 

■ 해설

 

정답 : ④

 

 

72. 다음은 Apache Spark에서 사용하는 데이터 구조에 대한 설명이다. 다음 설명에서 ㉮에 들어갈 용어로 가장 올바른 것은?

 
관계형 데이터베이스가 데이터 표현을 위한 추상화로 릴레이션을 사용하는 것처럼 Apache Spark은 ㉮라 불리는 데이터 표현 방식을 사용한다. Spark 에서 연산자는 하나 이상의 ㉮를 입력으로 받아 출력으로 ㉮를 반환하는 방식으로 계산을 수행한다.

 

① HDFS(Hadoop Distributed File System)

② HDFS(Hadoop Duplicated File System)

③ RDD(Resilient Distributed Dataset)

④ RDD(Reproducible Duplicated Dataset)

 

■ 해설

  • 정의 : RDD 는 Resillient Distributed Dataset 의 줄임말로 스파크의 기본 데이터 구조
  • 목적 : 대용량 데이터 처리 프레임워크인 hadoop 에서 사용하던 map reduce 의 파일 시스템 사용에 따른 처리 속도 및 데이터 공유 느린 문제를 해결하기 위해 spark rdd 로 넘어오게 됨
  • RDD의 특징
  1. 데이터의 분산(클러스터 분산저장, 하나의 파일처럼 사용)
  2. Resilient & Immutable(분산저장, 특정 노드 장애 시 복원)
  3. Type-safe(컴파일 시 Type 를 판별하여 문제를 일찍 발견)
  4. Unstructured / Structured Data(구조적, 비구조적 데이터 처리)
  5. Lazy Evaluatio Spark(미리 변환하지 않고 Action 시 Lazy 변환수행) Operation = TransForm + Action

 

정답 : ③

 





 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥