[2025 비식별 솔루션 리포트] 사용자의 ‘필요성’과 컴플라이언스 강화의 ‘강제성’이 시장 키운다

2025-07-11 09:58
  • 카카오톡
  • 네이버 블로그
  • url
갈수록 심화하는 개인정보 유출 사고, 비식별 솔루션으로 마지막 보안 빗장 걸다
비식별 솔루션에 대한 사용자 설문조사
비식별 솔루션 전문기업 집중분석: 에스에이티정보, 이지서티


[보안뉴스 원병철 기자] 개인정보보호위원회에 따르면, 2024년 한 해 동안 신고된 개인정보 유출 사고는 총 307건이며 주로 해킹(56%, 171건)으로 인해 발생했다. 또한 업무 과실이 30%(91건), 시스템 오류가 7%(23건)로 나타났다. 2023년 대비 해킹은 증가(151건 → 171건)했지만, 업무 과실(116건 → 91건)과 시스템 오류(29건 → 23건)로 인한 유출은 줄었다.


[자료: gettyimagesbank]

업무 과실로 인한 유출은 2024년에만 91건이 발생했고, 게시판이나 단체 채팅방 등에 개인정보 파일을 게시했거나(27건), 이메일을 동보 발송한 경우(10건), 그리고 이메일이나 공문 내 개인정보 파일을 잘못 첨부한 경우(7건)가 많았다. 아울러 시스템 오류로 인한 유출 사고도 23건이나 발생했으며, 주로 소스코드 적용 오류(14건)가 많았지만, API 연동 오류로 인해 개인정보가 권한 없는 자에게 표출되는 경우(8건)도 다수 있었다.

이처럼 개인정보 유출 사건은 해킹은 물론 조직 내 과실이나 시스템 오류 등 유형을 가리지 않고 발생한다. 때문에 개인정보를 보호하기 위해서는 단순히 사내 보안을 강화하고 보안 솔루션을 도입하는 것을 넘어 ‘개인정보’ 자체를 보호하는 방안을 마련해야 한다. 바로 비식별 솔루션이다.

비식별 기술, 개인정보와 같은 민감정보 보호와 활용 위해 탄생
비식별화(De-identification)는 말 그대로 비식별, 즉 알아보지 못하게 만드는 것을 말한다. 보통 개인정보와 같은 민감한 정보를 보호함과 동시 활용할 수 있도록 만들며, 최근 강화된 개인정보보호 컴플라이언스에 대응하기 위해 사용된다. 아울러 기업과 기관 등 조직들이 갖고 있는 데이터 중 가장 중요한 정보인 ‘개인정보’를 식별할 수 없도록 변환해 통계나 연구, 그리고 서비스 개발 등 다양한 목적으로 데이터를 안전하게 사용할 수 있도록 한다.

비식별화가 포괄적인 의미라면 가명처리(Pseudonymization)는 개인정보의 일부를 삭제하거나 대체해 추가 정보 없이는 특정 개인을 알아볼 수 없도록 하는 것을 말한다. 가명정보는 개인정보보호법 제2조 1의2에서 정의하고 있으며, 가명정보는 개인정보보호법의 적용을 받는다. 익명처리(Anonymization)는 시간, 비용, 기술 등을 합리적으로 고려할 때 더 이상 특정 개인을 알아볼 수 없도록 하는 것을 말한다. 재식별 가능성이 거의 없으므로 개인정보보호법에 적용을 받지 않아 자유롭게 활용하는 것이 가능하다.

이러한 비식별 기술이 정확하게 언제 개발됐는지 알 수 없지만, 현대 비식별 기술의 기초를 다진 것은 k-익명성 개념(k-anonymity)’ 개념을 제안한 미국 ‘라타냐 스위니(Latanya Sweeney)’ 하버드대 교수로 알려졌다. 그녀는 1997년 발표한 ‘Identifiability of data’ 논문에서, 공개된 정보와 비식별화된 데이터셋을 결합해 특정 개인을 재식별할 수 있음을 증명하며 비식별화의 한계와 그 위험성을 전 세계에 알렸다.

이후 2018년 EU의 GDPR(General Data Protection Regulation)이 활성화되면서 전 세계적으로 개인정보보호의 중요성이 강조됐고, 가명정보와 익명정보의 활용에 대한 기준이 제시되면서 비식별화 기술의 도입이 가속화됐다.

우리나라는 GDPR에 이어 2020년 데이터 3법이라 불리는 개인정보보호법과 정보통신망법, 신용정보법 개정으로 ‘가명정보’ 개념이 도입되면서 본격적으로 비식별 기술을 도입하기 시작했다.

글로벌 리서치 기업인 비즈니스 리서치 인사이트(Business Research Insights)는 ‘데이터 익명화/가명화 소프트웨어 보고서’를 통해 2024년 시장 규모를 4억3800만달러 규모로 평가했다. 또한 2025년 4억5700만달러에 도달하고 연평균 성장률 4.3%를 달성하면서 2033년에는 6억4700만달러를 기록할 것으로 예측했다. 보고서는 보안위협 증가와 산업의 디지털화에 따라 시장이 성장할 것이며, 특히 데이터 침해에 대한 우려가 커짐에 따라 데이터 비식별화 혹은 가명화 프로그램에 대한 수요가 증가하고 있다고 설명했다.

벨류에이츠 리포트(Valuates Reports)도 ‘2025 글로벌 데이터 익명화 또는 가명화 소프트웨어 시장 조사 보고서’를 통해 2024년 4억2800만달러로 평가했으며, 연평균 성장률 4.3%를 기록하며 2031년까지 5억7200만달러에 달할 것으로 내다봤다. 특히 이 보고서는 환자 개인정보보호와 건강보험 양도 및 책임법(HIPAA)과 같은 규정을 준수하기 위해 수요가 늘고 있다고 분석했다.


[자료: gettyimagesbank]

비식별 솔루션, 데이터 보호를 위한 최선의 선택
비식별 솔루션은 이러한 비식별화를 해주는 솔루션이다. 개인정보는 물론 기업이 갖고 있는 중요 문서 데이터를 중심으로 사용된다. 예를 들면, 기업의 영업비밀이나 기밀정보, 공공기관과 정부 데이터, 스마트 공장 등의 IoT 및 센서 데이터, 금융 거래 데이터, 의료 및 바이오 데이터, 산업안전 데이터 등 다양한 데이터를 보호하는 데 사용할 수 있다.

아울러 다양한 종류의 데이터를 보호하면서도 데이터가 가진 가치를 보존하고 활용할 수 있도록 도와준다. 공장의 생산량과 판매량, 원가 정보와 R&D 데이터 등에서 민감정보를 비식별화한 후 사용하면 시장 분석과 동향 파악 등 산업의 흐름을 파악하는 데 사용할 수 있다.

업계에서는 비식별 솔루션을 어떻게 정의할까? 에이씨엔에스는 “비식별 솔루션은 정형 또는 비정형 데이터에 포함된 비공개 대상 정보(개인정보, 민감정보, 기밀정보 등)를 알아볼 수 없도록 삭제하거나 치환해, 제3자가 해당 정보를 식별하지 못하도록 처리하는 기술”이라고 설명하고 있다.

지란지교데이터는 “개인정보 비식별화 솔루션은 정보의 일부 또는 전부를 대체하거나 삭제해, 특정 개인이 식별되지 않는 정보로 처리하는 소프트웨어를 의미한다”라면서, “2020년 개인정보 보호법 개정으로 가명정보 개념이 도입됨에 따라, 국내에서도 개인정보를 비식별 처리해 활용할 수 있는 길이 열렸다”라고 설명했다.

개인정보보호법 제28조의2 제1항은 ‘개인정보처리자는 통계 작성, 과학적 연구, 공익적 기록 보존 등을 위해 정보 주체의 동의 없이 가명정보를 이용, 제공, 결합 등 처리할 수 있다’고 규정하고 있다. 이에 따라 국내에서도 비식별화 시장이 본격적으로 개화하고 있으며, 개인정보 결합 전문기관을 중심으로 비식별화 솔루션 도입이 이뤄졌던 초기에 비해, 현재는 데이터 활용을 위해 비식별화 솔루션 도입 프로젝트가 늘어가는 추세다.

그렇다면 비식별 솔루션은 어떤 기술을 사용하고 있을까? 에이씨엔에스는 “비식별 솔루션은 처리 대상 데이터의 유형에 따라 정형 데이터와 비정형 데이터로 구분할 수 있다”라고 설명했다. 에이씨엔에스는 “정형 데이터는 데이터베이스, 엑셀 등 구조화된 데이터에 적용되며, 속성값을 치환하거나 삭제하는 방식, 총괄 처리(k-anonymity 등) 방식 등이 사용된다”라면서, “반면 비정형 데이터는 텍스트, 이미지, 음성, 영상, 문서 등 구조화되지 않은 데이터를 대상으로 하며, 이 중에서도 전자문서는 다양한 형식(PDF, HWP, DOCX 등)과 구조를 갖추고 있어 고유한 기술이 요구된다”라고 강조했다.

이지서티는 목적에 따른 구분을 설명했다. 바로 개인정보 데이터를 가명·익명처리하는 전문 솔루션과 각각의 가명정보를 결합해 결합정보를 생성하는 결합 솔루션이다. 이지서티는 “결합 전문기관과 데이터 전문기관에선 이 결합 솔루션을 사용한다”라고 덧붙였다.

지란지교데이터는 “국내에서 유통되는 개인정보 비식별화 솔루션은 대부분 개인정보보호위원회에서 제공하는 가명정보 처리 가이드라인에 맞춘 비식별 처리를 지원한다”고 강조했다. 예를 들면, △개인정보 삭제 기술(삭제, 부분 삭제, 행 항목 삭제, 로컬 삭제, 마스킹) △통계기술(총계 처리, 부분 총계) △일반화(범주화) 기술(일반 라운딩, 랜덤 라운딩, 제어 라운딩, 상하단 코딩, 로컬 일반화, 범위 방법, 문자 데이터 범주화) △암호화 기술(양방향 암호화, 일방향 암호화-암호학적 해시함수, 순서보존 암호화, 형태보존 암호화, 동형 암호화, 다형성 암호화) △무작위화 기술(잡음 추가, 순열-치환, 토큰화, 난수생성기) 등을 활용해 개인이 식별되지 않도록 가명 처리한다는 설명이다.

에스에이티정보는 “대부분의 개인정보가 전자문서에 담겨있기 때문에 문서 안의 객체정보, 즉 메타데이터를 텍스트와 테이블 등으로 분류한 후 비식별 처리를 한다”면서, “이중 전자문서의 비식별처리와 레거시 시스템의 비정형 데이터를 비식별 처리하는 솔루션과 정형 데이터를 비식별 처리하는 솔루션으로 나뉜다”고 구분했다. 또한 “전자문서의 특정 페이지나 특정 영역을 비식별 하기를 원하는 사용자 니즈도 있기 때문에 드래그 형식으로 영역을 변환하거나 특정 단어를 검색해 비식별 처리를 하는 기술도 필요하다”고 덧붙였다.


▲국내외 대표 비식별 솔루션[자료: 보안뉴스 정리]

개인정보 비식별에서 내부정보 비식별로 확대
비식별 솔루션을 도입하는 고객들은 대부분 개인정보보호에 집중되어 있다. 이는 개인정보가 다른 데이터가 더 중요하다는 의미가 아닌, 개인정보보호의 컴플라이언스가 더 강화되어 있기 때문이다.

다만 업계에 따르면 최근에는 개인정보가 아닌 업무상 민감한 내용이나 내부 기밀정보 등 주요 데이터를 함께 비식별 처리하려는 요구도 증가하고 있다. 특히 외부 기관과의 자료 공유나 AI 학습데이터 제공 등 2차 활용 목적이 있는 경우, 주요 데이터 유출 가능성까지 함께 고려하는 경우가 많아지고 있다는 설명이다.

지란지교데이터는 “비식별화 시장 초기에는 제공하는 비식별 알고리즘의 가지 수 또는 다중 알고리즘과 같이 개인정보 비식별 처리 기술 및 성능에 대한 니즈가 대부분이었지만, 최근에는 사용자의 비식별 솔루션에 대한 이해도 증가와 함께 활용 범위가 점차 확장되면서 통계, 정보 추출 등 원본/비식별 데이터 분석 및 평가 기능에 대한 니즈가 늘었다”면서, “비정형 데이터 비식별에 대한 수요도 증가하면서 데이터 비식별 및 검증, 평가 기능을 요구하는 경우도 보인다”고 설명했다.

즉, 비식별 솔루션에 대한 사용자의 이해도가 늘어나고 활용 범위가 확장되면서 통계나 정보 추출 등 원본과 비식별 데이터 분석과 평가 기능에 대한 니즈도 늘어나고 있다는 것이다.

일찍부터 개인정보보호를 위해 비식별 솔루션을 사용했던 공공기관의 경우 정보주체의 정보공개 요구, 데이터 공개, 개인정보 보호수준 평가 대응 등 다양한 방향에서 활용하고 있다는 의견도 나왔다. 이지서티는 “개인정보보호위원회에서 발표하는 가명정보 결합 우수사례를 보면, 여러 산업군과 현장에서 가명정보를 처리하고 결합을 통해 유용한 데이터를 생산하는 것을 살펴볼 수 있다”고 설명했다.

AI와 만난 비식별 솔루션
거의 모든 산업에 영향을 끼치고 있는 AI, 특히 생성형 AI는 비식별 솔루션에도 큰 영향을 주고 있다. 예를 들면, AI가 학습하는 데이터에 개인정보가 있는지 찾아 비식별하는 것과 AI를 활용해 비식별 처리 기술을 강화하는 것 모두 비식별 솔루션이 발전하는 데 도움이 된다.

에스에이티정보는 “개인정보를 탐지하는 것을 AI가 맡아 고도화하는 기술을 연구 중”이라면서, “성능 측면에서는 충분한 도움이 되지만, GPU 등 비용적인 면도 있어 활성화되기까지는 고민이 필요한 상황”이라고 설명했다.

또한 엘세븐시큐리티는 “이미지에서 개인정보를 추출하는 OCR 기술의 경우, 이미지 원본의 해상도에 영향을 많이 받는데, 이때 문서 양식을 학습한 AI가 있으면 개인정보를 탐지하는 것이 가능하다”라면서 개인정보 마스킹 부분에서 AI의 중요성을 강조했다.

이지서티는 “개인정보보호위원회에서 발간한 ‘안전한 인공지능(AI) 데이터 활용을 위한 AI 프라이버시 리스크 관리 모델(2025.02) 안내서’에서 AI 모델 시스템 개발자나 제공자 등의 개발 여건에 맞게 적용할 수 있는 AI 프라이버시 리스크 관리의 방향과 원칙을 제시하고 있다”면서, “이를 바탕으로 인공지능과 가명정보 처리에 대한 논의가 지속되고 있다”고 덧붙였다.


▲보안전문가들의 비식별 솔루션에 대한 설문조사[자료: 보안뉴스]

보안전문가들의 비식별 솔루션에 대한 설문조사
그렇다면 실제 보안전문가들은 비식별 솔루션에 대해 어떻게 생각할까? 시큐리티월드와 보안뉴스는 보안전문가들의 의견을 들어보기 위해 2025년 7월 1일부터 4일까지 4일간 약 10만여명의 보안전문가들에게 설문조사를 진행했다. 이번 설문조사에는 공공(24.3%)과 민간(75.7%)의 보안전문가 2224명이 답했다.

우선 보안전문가들은 어떤 종류의 민감 데이터를 제일 많이 활용하는지를 물어봤다. 응답자의 절반 이상인 54.9%가 ‘텍스트(고객 개인정보, 회원정보 등)’라고 답해 아직 텍스트 형태의 민감 데이터가 가장 많은 것으로 조사됐다. 하지만 ‘이미지(사진, 스캔 문서 등)’ 22.5%와 ‘영상(CCTV, 블랙박스 등)’ 14.9%, ‘음성(통화 내역, AI 음성 등)’ 7.7% 등 텍스트 외의 민감 데이터를 활용하는 응답자도 45.1%에 달해 텍스트 비중이 예전보다 줄어들었음을 알 수 있었다.

그렇다면 응답자들은 어떤 목적으로 민감 데이터를 활용할까? ‘고객/회원 관리 및 서비스 제공’을 선택한 사람이 43.7%였으며, ‘보안사고 예방’을 선택한 사람은 18.0%였다. 이어 ‘데이터 결합 및 제3자 제공’ 8.6%, ‘광고/홍보/마케팅’ 6.8%, ‘연구 목적’ 6.8%, ‘운영 효율화’ 5.9%, ‘통계 분석 및 연구’ 5.9%, ‘인사/채용(평판조회 등)’ 4.1% 순으로 조사됐다.

이어 응답자들이 비식별 조치를 어떻게 하고 있는지 물어봤다. 놀랍게도 응답자의 절반인 50%가 ‘담당자가 수작업으로 한다’고 답했다. 이어 ‘비식별 솔루션을 활용한다’가 38.7%, ‘비식별 전문기관 등 공공분야 지원을 받는다’가 11.3%였다.

실제 비식별 솔루션을 사용 중인 응답자들은 얼마나 있을까? 이에 대해 34.2%는 ‘비식별 솔루션을 사용중’이라고 답했고, 41.5%는 ‘사용하지 않는다’라고 답했다. 또한 10.8%는 ‘단기간 내에 도입할 계획’이라고 답했고, 13.5%는 ‘필요성에 공감하지만, 단기간 내에 도입할 계획은 없다’고 답했다.

사용자들이 가장 많이 사용하는 비식별 처리 기법은 무엇일까? 응답자의 절반 이상인 51.8%는 ‘데이터 마스킹’이라고 답했으며, 24.3%는 ‘가명 처리’라고 답했다. 이어 13.9%가 ‘데이터 삭제’를 6.8%가 ‘데이터 범주화’를 택했으며, 3.2%가 ‘데이터 통계처리’를 선택했다.

가장 안전하다고 생각하는 비식별 처리기법에 대한 물음에도 동일한 선택이 나왔다. 41.9%가 ‘데이터 마스킹’을 선택했으며, 26.6%가 ‘가명 처리’를 골랐다. 또한 22.1%가 ‘데이터 삭제’를, 5.0%가 ‘데이터 범주화’를 선택했다.

그럼 응답자가 가장 중요하다고 생각하는 비식별 솔루션 기능은 무엇일까? 절반에 가까운 48.6%는 ‘개인정보 식별 및 탐지’를 꼽았고, 20.7%는 ‘자동화된 대용량 처리 기능’을 선택했다. 이어 17.6%는 ‘다양한 비식별 기법’을, 13.1%는 ‘재식별 위험 분석 및 평가 기능’을 선택했다.

마지막으로 비식별 솔루션 도입시 가장 중요하게 생각하는 선택 기준에 대해 물어보자 35.6%의 응답자는 ‘비식별 기능’이라고 답했다. 이어 18.5%가 ‘다양한 구축사례와 레퍼런스’라고 답했으며, 13.9%는 ‘도입비용’이라고 답했다. 12.6%는 ‘기업 브랜드 인지도’를, 9.9%는 ‘유지보수, 컨설팅 등 기술지원과 전문인력 수’를, 9.0%는 ‘사내 IT 인프라 및 설비와의 호환성’을 각각 골랐다.

뚜렷한 변화 보이는 비식별 솔루션에 대한 사용자 니즈, 성장만 남았다
비식별 솔루션에 대한 사용자의 니즈는 최근 몇 년 사이 뚜렷하게 변화하고 있다. GDPR과 데이터 3법 개정으로 개인정보에 대한 강력한 컴플라이언스가 대두되고, 사이버 범죄자들의 기조가 단순 데이터 유출이나 암호화(랜섬웨어)를 넘어 데이터를 유출해 협박하는 방식으로 변화하면서 기업과 기관들의 데이터 보호는 최우선 이슈가 되고 있다. 게다가 복잡해진 네트워크와 클라우드 등 IT 기술을 사용하면서 발생할 수 있는 실수가 개인정보 유출을 불러오는 경우가 늘면서 비식별 솔루션에 대한 니즈가 증가하고 있다.

갈수록 심화하는 사이버 위협으로 조직의 핵심기술과 개인정보 등 주요 데이터가 유출됐을 때, 사전에 이를 비식별화했다면 최악의 경우는 피할 수 있을 것이다. 물론 개인정보나 주요 데이터를 보호하는 기술이 비식별 솔루션만 있는 것은 아니다. 하지만 안전하게 ‘보호’하고 동시에 ‘활용’할 수 있는 방법 중 비식별 솔루션만한 것이 없다.

게다가 업계에 따르면, 최근 사용자들은 문서를 클라이언트에 내려받지 않고 서버에서 직접 열람하며, 열람 시 자동으로 개인정보가 마스킹 되는 솔루션 환경을 선호하는 경향을 보인다. 즉, 사본 등록 과정에서 일어나는 실수 방지와 업무 효율성 확보를 동시에 충족할 수 있는 실시간·웹 기반 비식별 솔루션에 대한 수요가 빠르게 증가하고 있다는 설명이다.

이처럼 비식별 솔루션은 사용자의 ‘필요성’과 컴플라이언스 강화에 따른 ‘강제성’, 그리고 업무 환경의 변화에 따른 ‘가변성’ 등 3박자가 맞아 떨어진 만큼 앞으로 성장이 기대된다.

[BOX interview] 한국인터넷진흥원 가명정보 지원 플랫폼
가명정보 지원 플랫폼은 빅데이터와 인공지능 시대에 필수적인 양질의 데이터 확보와 안전한 활용을 지원하기 위해 만들어진 종합 서비스다. 2020년 개인정보보호법 개정으로 도입된 가명정보 제도를 현장에서 원활히 적용할 수 있도록 지원하기 위해 마련되었으며, 개인정보를 안전하게 가명처리하고 분석할 수 있는 데이터로 전환할 수 있도록 다양한 기능과 자료를 제공한다.

Q. 가명정보 지원 플랫폼이 제공하는 서비스는?
먼저 가명정보 제도 및 활용 방법을 안내한다. 주로 제도의 취지와 절차, 관련 법령 및 활용 사례 등을 소개한다. 다음으로 가명처리 및 데이터 결합을 지원한다. 온라인 기술 지원 도구와 오프라인 센터를 통한 가명처리·결합 환경을 제공한다. 또한 교육과 실습도 지원한다. 실무자를 위한 가명처리 기법 교육과 실습자료, 전문 컨설팅 등을 제공한다. 플랫폼은 공공기관, 민간기업, 연구기관 등 누구나 활용할 수 있으며, 가명정보를 활용한 데이터 기반 혁신을 실현할 수 있도록 제도적·기술적 지원을 아우르고 있다.

가명정보 지원 플랫폼은 다음의 세 가지 핵심 기능을 중심으로 데이터를 안전하게 활용할 수 있도록 지원한다.

① 수요·공급 연계
데이터를 활용하고자 하는 수요자(예: 연구자, 기업)와 데이터를 보유한 공급기관(예: 공공기관, 기업 등)을 연결해, 데이터 기반 협력 생태계를 조성한다. 예를 들어, 지역 분석을 위해 교통 데이터를 찾는 연구자와 해당 데이터를 보유한 지자체 간의 매칭 지원이 이뤄질 수 있도록 중개 역할을 수행한다.

② 컨설팅·기술지원
컨설팅은 가명정보 활용을 위한 서류작성, 가명처리, 적정성 검토, 결합, 데이터 분석 등 모든 과정을 지원하고 있다. 기술 지원은 온라인 기반의 가명처리 솔루션 제공, 처리 결과에 대한 리포팅 자동 생성 등 실무자가 활용할 수 있는 서비스로 구성되어 있다.

③ 가명정보 결합 지원
복수 기관의 가명정보 결합을 위해 결합 목적 안내, 신청서 작성 지원, 결합률 확인, 결합키연계정보 발급 등을 지원한다. 결합 수행은 결합전문기관이 담당하며, 플랫폼은 절차 이해와 준비 과정 전반을 행정적으로 돕는 역할을 수행한다.

Q. 가명정보 지원 플랫폼은 어떻게 사용할 수 있나?
가명정보 지원 플랫폼은 회원가입만으로 누구나 이용할 수 있는 온라인 포털로, 데이터 활용에 관심 있는 일반 사용자부터 실제 결합을 수행해야 하는 실무자까지 다양한 이용자 유형에 맞춘 맞춤형 서비스를 제공한다.

모든 서비스는 온라인으로 제공되며, 이용이 어려운 경우에는 플랫폼 내 ‘이용안내’ 메뉴를 활용하거나 전화 상담을 통해 친절한 안내와 지원을 받을 수 있다. 이처럼 가명정보 지원 플랫폼은 비전문가도 쉽게 접근할 수 있는 이용환경을 제공함으로써, 데이터 활용에 대한 진입장벽을 낮추고, 현장의 활용 역량을 강화하는 데 기여하고 있다.

Q. 앞으로의 계획은
가명정보 지원 플랫폼은 AI와 관련된 데이터 수요 증가에 맞춰 정형데이터와 더불어 영상, 음성, 텍스트 등 비정형 데이터의 안전한 활용을 지원할 수 있도록 개편해 나갈 예정이다.

첫째, 가명정보 제도 변화에 맞춰 가명정보 지원 플랫폼도 이를 반영할 수 있도록 이용자 중심으로 개편해 나갈 예정이다. 이를 위해 이용자 중심의 UX/UI 개선, 접근성 향상, 절차 간소화를 지속적으로 추진할 계획이다.

둘째, 의료·복지·교육 등 국민 생활과 밀접한 분야에서의 데이터 활용사례를 발굴·확산해 국민 체감 효과를 높일 계획이다.

셋째, 온라인 기반 교육 콘텐츠 확대와 산업별 맞춤형 교육 프로그램 운영을 통해 정보 접근성이 낮은 국민도 데이터 활용에 참여할 수 있도록 교육격차 해소에 주력할 예정이다.

앞으로도 플랫폼은 누구나 신뢰하고 쉽게 활용할 수 있는 공공 데이터 기반 지원 인프라로서, 데이터 기반 사회로의 전환을 뒷받침하는 핵심 역할을 수행할 것이다.


▲에스에이티정보 Docu-GUARD GT4[자료: 에스에이티정보]

[비식별 솔루션 집중분석-1] ‘에스에이티정보’
에스에이티정보 전자문서 개인정보 비식별 솔루션 ‘Docu-Guard’
문서 내 개인정보 자동 검출·처리 체계로 정보 활용과 데이터 반출 및 AI 학습 기반 마련


에스에이티정보는 비정형 전자문서 내 개인정보를 자동으로 검출하고 비식별 처리하는 개인정보보호 솔루션 ‘Docu-Guard’를 앞세워, 공공기관 및 민간기업의 데이터 활용 혁신을 본격화하고 있다.

‘Docu-Guard’는 생성형 AI와 데이터 기반 행정이 활성화되는 흐름 속에서, 개인정보보호와 안전한 정보 활용을 동시에 달성하기 위한 전략적 솔루션이다. 기존 개인정보보호 체계가 구조화된 DB 중심이었다면, Docu-Guard는 한글, MS 오피스, PDF 등 다양한 문서 파일에서 텍스트와 이미지 정보를 추출·분석해 문서 내 개인정보를 자동으로 식별하고 비식별 처리해 반출 가능한 PDF 형태로 제공한다.

비정형 문서 대응 가능한 개인정보 비식별화 체계
‘Docu-Guard’는 개인정보를 포함하는 텍스트, 표 등을 통합 분석하는 고유의 처리 구조를 갖추고 있으며, 문서 작성 형식과 스타일에 따라 레이아웃과 문장 구조를 해석해 민감정보를 자동 식별한다. 자동 비식별 처리된 결과물은 뷰어 기반으로 원문과 비교 검토가 가능하고, 사용자가 직접 수동 보완 처리도 가능해 신뢰성과 정확성을 높였다.

AI 시대, 데이터 반출과 신뢰 기반 데이터 구축 동시 실현
‘Docu-Guard’는 단순한 비식별화 기능을 넘어 AI 학습용 개인정보 비식별 처리 데이터 제공, 정보공개 청구 대응, 민원 자료 반출 등 다양한 데이터 기반 업무에 활용할 수 있도록 설계됐다. 또한 자체 API를 통해 기관별 문서 뷰어, 개인정보 탐지 시스템과 유기적으로 연동되며, 정보보호와 활용의 균형을 이루는 디지털 전환 기반 인프라로 주목받고 있다.

에스에이티정보는 “AI 시대를 맞아 비정형 문서에 포함된 개인정보를 효과적으로 처리하는 것이 데이터 활용의 전제조건”이라며, “Docu-Guard는 공공기관의 정보공개 요청 대응부터 기업의 민감정보 처리까지 다양한 환경에서 안전한 데이터 반출을 가능하게 하는 실질적 대안이 될 것”이라고 밝혔다.


▲이지서티 IDENTITY SHIELD v3.0[자료: 이지서티]

[비식별 솔루션 집중분석-2 ‘이지서티’
이지서티 지능형 자동 비식별화·결합 솔루션 ‘IDENTITY SHIELD v3.0’
개인정보 비식별, 가명처리로 AI 데이터 산업 활성화에 높은 기여


개인정보보호 솔루션 전문기업 이지서티의 가명정보 비식별화·결합 솔루션 IDENTITY SHIELD v3.0이 데이터 산업의 최전선에서 활용되며 안전한 개인정보의 비식별처리와 가명정보 활용 및 결합에 중추적 역할을 하고 있다.

개인정보를 안전하게 보호하면서 활용할 수 있는 가명정보는 AI 및 데이터 산업 시대에 필수적인 요소로서 개인정보보호법을 준수하는 가명정보 전문 솔루션에 대한 사용이 확대되고 있다.

공공기관, 민간기업 전문기관에서 활발히 사용 중인 IDENTITY SHIELD v3.0
가명결합 솔루션 IDENTITY SHIELD v3.0는 국내 결합 전문기관과 데이터 전문기관에서 가명정보 및 신용정보 데이터 결합에 적극 활용되고 있다. 대용량 데이터를 다루는 전문기관의 ‘사전검토-결합-반출-사후관리’ 업무 프로세스를 지원하고, In-Memory 기술을 통해 빠르게 가명처리 및 결합 업무를 구현해 준다.

특히 가명정보 처리 업무에서 ‘고속분산 가명처리(Parallel Deidentification)’ 기술은 2500억 건의 데이터를 가명처리할 수 있어 클라우스 성능 평가에서도 인증을 취득한 제품이다. 개인정보 데이터를 취급하는 연구기관과 산업단체, 정부기관, 금융, 보험 등 민간기업에서 활발하게 사용 중이며 데이터 산업에서 핵심적 중추 역할을 하고 있다.

AI 시대, 공공기관 개인정보 보호수준 평가에도 활용
최근 발생하고 있는 개인정보 유출 사고는 외부 공격이 주요 원인이면서 관리자 업무 과실도 포함된다. 암호화 저장 외에도 비식별처리 조치는 개인정보의 안전성 확보에도 주요한 조치 사항으로 활용된다. 데이터 제공·활용이 활달한 민간기업에서는 통계작성 및 산업적 연구 목적으로 가명처리를 하는데 가명정보 처리 가이드라인에 따라 필수 요건을 적용하는 것이 중요하다. IDENTITY SHIELD v3.0는 가이드라인을 필수사항 및 권고사항을 준수하고 가명정보 처리자의 업무를 도와주는 직관적 메뉴를 제시해 안전한 가명처리 업무를 수행한다.

특히 공공기관 대상 개인정보 보호수준 평가에서 제시하는 가점 지표인 ‘신기술을 이용한 개인정보의 안전한 활용 및 리스크 관리’에도 적극 활용할 수 있도록 PET(Privacy Enhanced Technology)를 효율적으로 구현한다.

개인정보를 처리하는 다양한 환경에서 가명·익명정보 처리는 개인정보의 안전조치 사항으로서 인식이 확대되면서 IDENTITY SHIELD v3.0의 수요는 계속해서 확대되고 있다.

AI 시대를 맞아 다양한 생성형 AI(LLM)를 구축하는 사례가 늘고 있고, Query 및 원하는 결과를 얻는 과정에서도 개인정보 비식별 처리를 실시간으로 제공하고 있다. 또한, 파인튜닝 과정에서도 개인정보를 가명화해 향후 발생할 수 있는 개인정보 문제를 원천적으로 막을 수 있으며, 시중에 공개된 각종 LLM 기술과 높은 호환성을 제공하고 있다.

[원병철 기자(boanone@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

연관 뉴스

헤드라인 뉴스

TOP 뉴스

이전 스크랩하기


과월호 eBook List 정기구독 신청하기

    • 씨프로

    • 인콘

    • 엔텍디바이스코리아

    • 핀텔

    • 아이비젼

    • 아이디스

    • 씨프로

    • 웹게이트

    • 엔토스정보통신

    • 하이크비전

    • 한화비전

    • ZKTeco

    • 비엔에스테크

    • 지오멕스소프트

    • 원우이엔지

    • 지인테크

    • 홍석

    • 이화트론

    • 다누시스

    • 테크스피어

    • TVT코리아

    • 슈프리마

    • 인텔리빅스

    • 시큐인포

    • 미래정보기술(주)

    • 세연테크

    • 비전정보통신

    • 트루엔

    • 경인씨엔에스

    • 한국씨텍

    • 성현시스템

    • 아이원코리아

    • 프로브디지털

    • 위트콘

    • 다후아테크놀로지코리아

    • 한결피아이에프

    • 스피어AX

    • 동양유니텍

    • 포엠아이텍

    • 넥스트림

    • 펜타시큐리티

    • 에프에스네트워크

    • 신우테크
      팬틸드 / 하우징

    • 옥타코

    • 네이즈

    • 케이제이테크

    • 셀링스시스템

    • 네티마시스템

    • 아이엔아이

    • 미래시그널

    • 엣지디엑스

    • 인빅

    • 유투에스알

    • 제네텍

    • 주식회사 에스카

    • 솔디아

    • 지에스티엔지니어링
      게이트 / 스피드게이트

    • 새눈

    • 에이앤티글로벌

    • 케비스전자

    • 한국아이티에스

    • 이엘피케이뉴

    • (주)일산정밀

    • 구네보코리아주식회사

    • 레이어스

    • 창성에이스산업

    • 엘림광통신

    • 에이앤티코리아

    • 엔에스티정보통신

    • 와이즈콘

    • 현대틸스
      팬틸트 / 카메라

    • 엔시드

    • 포커스에이아이

    • 넥스텝

    • 인더스비젼

    • 메트로게이트
      시큐리티 게이트

    • 엠스톤

    • 글로넥스

    • 유진시스템코리아

    • 카티스

    • 세환엠에스(주)

Copyright thebn Co., Ltd. All Rights Reserved.

시큐리티월드

IP NEWS

회원가입

Passwordless 설정

PC버전

닫기