이름, 소속, 아이디, 전화번호 등 4개 항목...구글 검색엔진이 크롤링으로 보안 뚫어
[보안뉴스 김영명 기자] 교육부 산하 한국교육학술정보원(이하 학술정보원)의 지식샘터 홈페이지에서 8월 8일 교원 300여명의 개인정보가 유출된 것으로 알려졌다. 유출된 항목은 이름, 소속, 전화번호, 아이디 등 4개 항목인 것으로 추정된다.

▲한국교육학술정보원 지식샘터 홈페이지 메인화면[자료=지식샘터 홈페이지]
이번 사고는 8월 8일 22시쯤 가입한 교사들의 발견으로 확인됐다. 피해 규모는 지식샘터 홈페이지에 가입한 교원 353명이며, 이들의 이름과 전화번호 등 4개 항목이 구글 검색 페이지에 그대로 노출됐다. 피해를 입은 교원은 2022년부터 지식샘터 내 ‘강좌수강’ 하위 카테고리 6개 중 하나인 ‘학교단위강좌’를 신청한 이들로 전해졌다.
이번 사고는 홈페이지를 관리·운영하는 학술정보원 측이 아닌 가입된 교사들이 먼저 문제가 있는 것을 파악해 학술정보원 측에 시스템 상 오류가 있음을 제보한 이후에 알려졌다. 학술정보원 측은 현재 이 같은 사고가 언제부터 발생했는지 제보를 받기 전까지 전혀 파악하지 못하고 있었다. 이어 제보를 받고 사건을 인지한 다음 6시간이 지난 뒤에 모든 보완 조치가 완료됐다고 안내했다.
이번 사고의 주요 원인은 구글 검색엔진의 크롤링(Crawling) 기법에 의한 것으로 드러났다. 크롤링은 구글 검색엔진이 자동으로 웹을 탐색하는 과정을 의미한다. 구글의 크롤러(또는 스파이더)는 인터넷상의 웹페이지를 방문해 해당 페이지의 내용을 스스로 읽고 링크로 연결된 페이지로 이동하며 새로운 페이지를 찾아간다. 이러한 과정을 끊임없이 반복하며 인터넷상 수많은 페이지를 크롤링 통해 구글의 자체 데이터베이스인 ‘색인’에 추가한다. 색인에 추가될 때는 해당 페이지의 텍스트, 이미지, 동영상 파일 등 모든 내용들이 분석 및 저장된다.
[김영명 기자(boan@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>