정보관리기술/최신서비스

개인정보의 가명 익명처리 기술

아이티신비 2024. 4. 28. 09:00

문제10) 개인정보의 가명 익명처리 기술에 대하여 설명하시오

답)

 

1.개인정보의 가명 익명 처리의 기술 개요

가명처리 개념
익명처리 개념
개인정보의 일부를 삭제하거나 일부 또는전부를 대체하는 등의 방법으로 추가 정보가 없 이는 특정 개인을 알아볼 수 없도록처리하는 기술(개인정보보호법 제 2 조 1 의 2)
개인식별정보를 영구적으로 삭제하거나, 개인식별정보의 전부 또는 일부를 해당 기관의 고 유식별기호로 대체하는 기술
  • 비식별 정보 가이드라인 개인정보 3 법 개정 이후, 가명처리 가이드라인으로 변경 사용

 

2. 개인정보의 가명 익명처리의 주요기술

구분
항목
설명
삭제기술
삭제
  • 원본정보에서 개인정보를 단순 삭제
  • 부분삭제, 로컬삭제, 행 항목 삭제 등 다양한 기법 존재
마스킹
  • 특정 항목의 일부 또는 전부를 공백 또는 문자로 대체
통계도구
총계처리
  • 평균값, 최대값, 최소값, 최빈값, 중간값 등으로 처리
부분 총계
  • 다른 정보에 비하여 오차 범위가 큰 항목을 평균값 등으로 대체
일반화
일반 라운딩
  • 올림, 내림, 반올림 등의 기준을 적용하여 집계 처리하는 방법
랜덤 라운딩
(Random rounding)
  • 수추 데이터를 임의의 수인 자리 수, 실제 수 기준으로 올림(round up) 또는 내림(round dowm) 하는 기법
제어 라운딩
(Controlled rounding)
  • 라운딩 적용 시 값의 변경에 따라 행이나 열의 합이 원본의 행이나 열의 합과 일치하지 않는 단점을 해결하기 위해 원본과 결과가 동일하도록 라운딩을 적용하는 기법
상하단코딩(Top and bottorm coding)
  • 정규분포의 특성을 가진 데이터에서 양쪽 끝에 치우친 정보는 적은 수의 분포를 가지게 되어 식별성을 가질 수 있음
  • 이를 해결하기 위해 적은 수의 분포를 가진 양 끝단의 정보를 범주화등의 기법을 적용하여 식별성을 낮추는 기법
로컬 일반화
  • 전체 정보집합물 중 특정 열 항목(들)에서 특이한 값을 가지거나 분포상의 특이성으로 인해 식별성이 높아지는 경우 해당 부분만 일반화를 적용하여 식별성을 낮추는 기법
범위 방법(Data range)
  • 수치 데이터를 임의의 수 기준의 범위(range)로 설정하는 기법으로, 해당 값의 범위 또는 구간(interval) 으로 표현
문자데이터 범주화
  • 문자로 저장된 정보에 대해 보다 상위의 개념으로 범주화하는 기법
암호화
양방향 암호화
  • 특정 정보에 대해 암호화와 암호화된 정보에 대한 복호화가 가능한 암호화 기법(대칭키, 비대칭키 방식으로 구분)
암호학적 해쉬함수
  • 원문에 대한 암호화의 적용만 가능하고 암호문에 대한 복호화 적용이 불가능한 암호화 기법(MDC, MAC 로 구분)
순서보존 암호화
  • 원본정보의 순서와 암호값의 순서가 동일하게 유지되는 암호화 방식
형태보존 암호화
  • 원본 정보의 형태와 암호화된 값의 형태가 동일하게 유지되는 암호화 방식
동형암호화
  • 암호화된 상태의 연산값을 복호화 하면 원래의 값을 연산한 것과 동일
무작위화기술
잡음추가
  • 개인정보에 임의의 숫자 등 잡음을 추가하는 방법
치환
  • 분석 시 가치가 적고 식별성이 높은 열 항목에 대해 대상 열 항목의 모든 값을 항목 내에서 무작위로 순서를 변경하여 식별성을 낮추는 기법
토근화
  • 개인을 식별할 수 있는 정보를 토큰으로 변환 후 대체함으로써 개인정보를 직접 사용하여 발생하는 식별 위험을 제거하여 개인정보를 보호하는 기술
(의사)난수생성기

  • 주어진 입력값에 대해 예측이 불가능하고 패턴이 없는 값을 생성하는 매커니즘으로 임의의 숫자를 개인정보와 대체
기타 기술
표본추출(Sampling)
  • 데이터 주체별로 전체 모집단이 아닌 표본에 대해 무작위 레코드 추출등의 기법을 통해 모집단의 일부를 분석하여 전체에 대한 분석을 대신하는 기법
해부화(Anatomization)
  • 기존 하나의 데이터셋(테이블)을 식별성이 있는 정보집합물과 식별성이 없는 정보집합물로 구성된 2개의 데이터셋으로 분리하는 기술
재현데이터(Synthetic data)
  • 원본과 최대한 유사한 통계적 성질을 보이는 가상의 데이터를 생성하기 위해 개인정보의 특성을 분석하여
동형비밀분산(Homemorphic secret sharing)
  • 식별정보 또는 기타 식별가능정보를 메시지 공유 알고리즘에 의해 생성된 두 개 이상의 쉐어(share)로 대체
  • 기밀사항을 재구성하는데 사용할 수 있는 하위 집합
차분 프라이버시
(Differential privacy)
  • 특정 개인에 대한 사전지식이 있는 상태에서 데이터베이스 질의(Query)에 대한 응답 값으로 개인을 알 수 없도록 응답 값에 임의의 숫자 잡은(Noise)를 차가하여 특정 개인의 존재 여부를 알 수 없도록 하는 기법
  • 1개 항목이 차이나는 두 데이터베이스간의 차이(확률분포)를 기준으로 하는 프라이버시 보호 모델
  • 개인정보 비식별화 조치 가이드 라인, ISO/IEC 29889 을 통한 가명 정보 처리 절차도에 따른 관리 필요

 

3. 개인정보 익명의 가명 정보의 처리 절차도

  • 절차에 근거한 기술 보호, 물리적 보호 조치의 가명정보 기술을 이용한 안전한 관리 방안 체제 개인정보보호 필요

 

 


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

 

 

 

'정보관리기술 > 최신서비스' 카테고리의 다른 글

코드형 인프라스트럭처 / ①  (63) 2024.04.29
큐비트(Qubit) / ①  (2) 2024.04.28
뉴로모픽칩(Neuromorphic Chip) / ①  (1) 2024.04.27
SRGM(Software Reliability Growth Model)`  (1) 2024.04.27
IT 투자평가  (2) 2024.04.26