빅데이터 처리, 특정 개인 식별할 수 없도록 암호화 필요
[보안뉴스 김태형] “빅데이터 처리과정 중 맵리듀스(MapReduce)의 소스 데이터 가운데 개인정보들이 있을 수 있는데 이를 통해서 특정 개인을 식별할 수 없도록 익명화해야 하고, 정보의 사용여부를 개인에게 알려주어야 한다. 또한, 맵리듀스 환경에서 암호화 기술을 적용해야 한다.”
김형종 서울여대 교수는 지난 7일 방송통신위원회가 주최한 ‘개인정보보호 법제정비 연구포럼 토론회’에서 ‘빅데이터 환경에서 개인정보보호를 위한 기술’이라는 주제 발표를 통해 이같이 말했다.
김형종 교수는 “Hadoop Core MapReduce 프레임워크는 빅데이터의 핵심처리 기술로, 여기서 맵리듀스를 통해 특정한 목적 달성을 위한 가공된 정보(Derived Data)를 추출할 수 있다”면서 “특히, 맵리듀스의 소스가 되는 정보 중 개인정보가 존재할 수 있고 여기서 활용되는 정보의 소유자에 대한 인지가 가능하다. 또 맵리듀스 결과가 특정한 개인 혹은 개인이 속한 집단의 특성을 나타낼 수 있다”고 설명했다.
빅데이터 환경에서 개인정보는 클라우드에 존재하고 이들이 분석되어 상위정보를 얻는데 활용되는 상황에서 개인정보의 익명화 문제나 개인정보 제공 시 이 사실을 개인이 인지해야 하는 문제가 발생한다.
이에 개인은 데이터 처리 과정에서 자신의 정보 제공에 대한 동의가 필요하고 동의를 얻기 위해서는 빅데이터의 처리 결과가 반드시 개인에게 도움이 된다는 사실이 인지되어야 한다.
이 때 데이터의 저장 시 중요 정보에 대한 암호화가 되어야 하며 Key 정보를 안전하게 관리해야 한다. 그리고 개인 및 시스템 인증에 사용하는 증명(Credential)에 대한 관리도 문제가 된다.
김형종 교수는 “이러한 문제를 해결하기 위해서는 기술적 관점에서의 암호기술이 중요하다. 하둡(Hadoop)에서의 데이터 암호화, 저장되는 블록들에 대한 독립적인 암호화가 요구되며, 이를 위한 Key 설정이 필요하다”고 말했다.
즉, 서로 다른 키를 사용해야 하는 다중 계층에 대한 처리 방법과 데이터 처리 결과에 대한 암호화 방안을 통한 적절한 익명화와 암호화가 필요하다는 것.
김 교수는 “무엇보다 가장 중요한 것은 빅데이터를 통한 개인정보 침해 우려를 최소화할 수 있는 적절한 빅데이터 처리 솔루션이 나와야 한다는 점”이라고 강조했다.
[김태형 기자(boan@boannews.com)]
<저작권자: 보안뉴스(http://www.boannews.com/) 무단전재-재배포금지>








.gif)





