가명데이터 활용에 대해서 알아봅시다.

데이터결합분석 서비스 관련하여 궁금하신 사항은 이곳으로 문의주세요.

가명데이터 활용을 위한 사전준비란 무엇인가요?

가명데이터 활용 사전준비란 가명처리 대상 항목과 처리 수준을 정의하는 것입니다. 이를 위해 처리 목적이 적합한지 여부를 확인하고 필요한 서류를 작성해야 합니다. 또한, 가명처리의 목적을 명확히하고 내부 승인절차를 설정한 경우, 이에 따른 추가 업무를 수행할 수 있습니다. 가명정보를 제3자에게 제공하는 경우, 이용 목적 및 방법, 재식별 위험관리 등 가명정보의 안전성을 확보하기 위해 필요한 조치를 포함한 계약을 체결할 수 있습니다.

또한 가명정보의 안전한 활용을 위해 개인정보처리방침을 수립·공개하고 내부관리계획 수립·시행 등 가명정보 처리에 앞서 이행해야 할 사항을 준비해야 합니다.

가명데이터 활용을 위한 가명처리란 무엇인가요?

가명정보 처리 시에도 개인정보의 최소처리원칙을 준수해야 하며, 가명처리 방법을 정할 때에는 처리 목적, 처리(이용 또는 제공)환경, 정보의 특성 등을 종합적으로 고려해야 합니다.
  • 목적에 필요한 최소한의 항목만을 가명처리 대상으로 선정하고, 개인정보파일에서 가명처리 대상 항목을 추출해야 합니다.
  • 추출한 결과 정보의 '항목별 위험도 측정'은 가명정보처리자의 안전조치 수준이나 정보 자체의 재식별 가능성을 고려하여 판단해야 하므로 내부 활용·제공과 제3자 제공 시 고려해야 할 사항이 달라질 수 있습니다.
  • 항목별 위험도 측정이 완료되면 이를 고려하여 항목별 가명처리 방법과 수준을 정의하고, 이에 따라 가명처리를 수행하세요.

가명처리 방법에는 어떠한 기술이 있나요?

가명처리는 개인정보의 식별 가능성을 줄이기 위한 기술로, 삭제기술, 통계도구, 일반화(범주화) 기술, 암호화, 무작위화, 재현데이터, 차분프라이버시 등의 다양한 방법과 기법이 있습니다.

  • 삭제 기술은 개인정보에서 직접적으로 개인을 식별할 수 있는 데이터를 전체 또는 부분삭제하는 방법입니다. 이 방법은 가장 간단하고 확실하지만, 삭제된 정보는 되돌릴 수 없기 때문에 데이터의 활용도가 줄어들 수 있습니다.
  • 통계 도구는 데이터 집합에서 통계적 기법을 활용하여 개인을 식별하기 어렵게 만드는 방법입니다. 예를 들어,총계처리 및 부분총계 등의 방법이 있습니다.
  • 일반화(범주화) 기술은 데이터의 세부 정보를 큰 범주로 만들어 식별이 어렵게 하는 기법입니다. 예를 들어, 연령을 정확한 나이가 아닌 연령대로 표현하거나, 주소를 구/시 단위로만 표현하는 것입니다.
  • 암호화는 정보가공시 일정한 규칙의 알고리즘을 적용하여 대체하는 기법입니다.
    일방향 암호화, 순서보존암호화, 형태보존암호화 방식 등이 있습니다.
  • 무작위화는 데이터에 무작위의 값이나 노이즈를 추가하여 원본 데이터를 인식하기 어렵게 만드는 방법입니다. 예를 들어, 실제 값에 무작위 값을 더하거나 빼서 저장하는 것입니다.
가명처리기법의 기술, 세부기술, 설명
기술 세부기술 설명
삭제기법 행 항목 삭제 다른 정보와 뚜렷하게 구별되는 행 항목을 삭제
로컬 삭제 특이정보를 해당 행 항목에서 삭제
마스킹 특정 항목의 일부 또는 전부를 공백 또는 문자(' *, '' _ '등이나 전각 기호)로 대체
통계도구 총계처리 평균값, 최댓값, 최솟값, 최빈값, 중간값 등으로 처리
부분총계 정보집합물 내 하나 또는 그 이상의 행 항목에 해당하는 특정 열 항목을 총계처리. 즉, 다른 정보에 비하여 오차 범위가 큰항목을 평균값 등으로 대체
일반화
(범주화) 기술
일반 라운딩 올림, 내림, 반올림 등의 기준을 적용하여 집계 처리하는방법
랜덤 라운딩 수치 데이터를 임의의 수인 자리 수, 실제 수 기준으로 올림(round up) 또는 내림(round down)하는 기법
상하단코딩 정규분포의 특성을 가진 데이터에서 양쪽 끝에 치우친 정보는 적은 수의 분포를 가지게 되어 식별성을 가질 수 있으므로 범주화 등의 기법을 적용하여 식별성을 낮추는 기법
로컬 일반화 전체 정보집합물 중 특정 열 항목(들)에서 특이한 값을 가지거나 분포상의 특이성으로 인해 식별성이 높아지는 경우 해당 부분만 일반화를 적용하여 식별성을 낮추는 기법
범위 방법 수치 데이터를 임의의 수 기준의 범위(range)로 설정하는 기법으로, 해당 값의 범위 또는 구간(interval)으로 표현
문자데이터 범주화 문자로 저장된 정보에 대해 보다 상위의 개념으로 범주화하는 기법
암호화 일방향 암호화
- 암호학적 해시함수
  • 원문에 대한 암호화의 적용만 가능하고 암호문에 대한 복호화 적용이 불가능한 암호화 기법
  • 암호화(해시처리)된 값에 대한 복호화가 불가능하고, 동일한 해시 값과 매핑(mapping)되는 2개의 고유한 서로 다른 입력값을 찾는 것이 계산상 불가능하여 충돌 가능성이 매우 적음
무작위화 기술 잡음 추가 개인정보에 임의의 숫자 등 잡음을 추가(더하기 또는 곱하기)하는 방법

[가명처리기법]

적정성검토란 무엇인가요?

적정성 검토는 목적 달성을 위해 가명처리 작업이 적절한 수준으로 수행되었는지 확인하는 최종적인 판단과정입니다.
이 단계에서는 가명처리된 데이터가 목적을 달성하기 어렵거나 재식별 가능성이 있는지 여부를 판단합니다. 만약 재식별 가능성이 있다고 판단된다면 가명처리를 반복하거나 추가적인 가명처리를 수행할 수 있습니다. 또한, 데이터의 분포와 값을 분석하여 특이정보가 존재한다고 판단된 경우에는 재식별 가능성을 낮추기 위해 적절한 조치를 취해야 합니다.

가명데이터 활용 주의사항은 무엇인가요?

적정성 검토 결과 가명처리가 적정하다고 판단되면, 가명정보를 원래의 목적에 맞게 처리할 수 있으며, 관련 법령에 따라 기술적, 관리적, 물리적인 안전조치를 수행해야 합니다. 또한 가명정보 처리 담당자는 가명정보를 안전하게 처리하기 위해 금지 행위 및 안전조치에 대한 지침을 가명정보 취급자에게 제공해야 합니다.

특히 개인정보처리자는 가명정보의 처리목적, 개인정보 항목, 이용내역, 제3자 제공 시 제공받는자를 작성하여 보관하여야 합니다.

공유하기