여기에 텐서플로라는 인공지능 알고리즘 추가...개인화된 차단까지도 가능
[보안뉴스 문가용 기자] 구글이 텐서플로(Tensorflow)를 구축한 이후 하루에 1억개 이상의 스팸 메일을 추가로 차단할 수 있게 되었다고 발표했다. 텐서플로는 구글이 개발한 머신러닝 오픈소스 프레임워크다.

[이미지 = iclickart]
지메일에 머신러닝이 적용된 건 이번이 처음이 아니다. 구글은 꽤나 오래 전부터 스팸을 거르기 위해 다양한 방법들을 사용해왔다. 그래서 현재 스팸 차단 비율을 99.9%로까지 올렸다. 그럼에도 공격자들에게 있어 지메일의 150억 사용자와 5백만 기업 클라이언트는 늘 군침 도는 공격 대상이다. 그래서 공격 시도가 끝없이 이어진다.
지메일의 사용자가 150억에 달하는데, 하루 1억 개의 메일이 추가로 차단된다는 건 그리 대단치 않아 보인다. 그러나 99.9%의 스팸 및 악성 메일을 지메일이 차단한다고 했을 때, 나머지 0.1% 중에서 1억 개는 무시하기 힘든 숫자다. 게다가 그 0.1%가 99.9%의 공격 시도보다 통상 수준이 높을 가능성이 있다는 것을 생각해보면 더더욱 그렇다.
텐서플로는 구글의 인공지능 부문 내 구글 브레인(Google Brain) 팀이 2015년 개발한 인공지능 툴로, 구글만이 아니라 인텔, SAP, 에어비앤비(Airbnb), 퀄컴(Qualcomm) 등에서도 활발하게 사용되고 있다. 구글의 네일 쿠마란(Neil Kumaran)은 “텐서플로 덕분에 이전에는 탐지하기 힘들었던 스팸 메일을 더 높은 확률로 찾아낼 수 있게 되었다”고 블로그 게시글을 통해 밝혔다.
“텐서플로는 구글이 이미 사용하고 있는 머신러닝 기반 스팸 보호 기능의 부족한 부분을 메워주고 있으며, 그 동안 해결하지 못했던 0.1%의 스팸메일을 차단하기 시작했습니다. 이미지를 기반으로 한 메시지, 악성 엠베드 내용물이 숨겨져 있는 이메일, 새롭게 생성된 도메인에서부터 발송된 악성 메시지, 스팸이지만 볼륨이 낮아 정상 트래픽과 구분이 가지 않는 경우가 대표적입니다.”
그 동안 구글이 사용해왔던 건 규칙 기반의 필터였다. 여기에 머신러닝 모델을 추가해 사람들이 받고 싶어 하지 않는 이메일의 패턴을 학습하도록 했다. 이것만으로도 정상 이메일과 비정상 이메일을 구분해내는 데 상당히 성공했는데, 여기에 텐서플로까지 더해 보다 정교해진 것이다. 뿐만 아니라 쿠마란은 “텐서플로 덕분에 개인화 된 스팸 차단까지도 가능하게 되었다”고 말한다. “누구에게는 스팸일 수 있고, 누구에게는 아닐 수도 있는데, 이런 애매한 부분까지 가려낼 수 있게 된 것입니다.”
머신러닝 알고리즘을 광범위하게 적용하는 건 굉장히 난이도가 높은 일이고, 시간도 많이 걸린다. 텐서플로의 적용 역시 아직 완전히 이뤄진 건 아니다. 구글은 이 과정을 보다 간소화하려는 목표 역시 가지고 있다. “그러면서 최적화된 모델을 찾아내고자 합니다. 인공지능을 기존 서비스에 덧붙이는 게 어려운 일이기 때문에, 이왕 할 때 가장 좋은 걸 하려는 것입니다.”
그러므로 지메일의 보안은 구글의 가장 큰 과제 중 하나다. 최근 사업 이메일 침해(BEC) 공격자들은 지메일의 비슷한 이메일 주소를 하나로 인지하는 기능을 악용해 공격 효율을 높이기도 했다.
3줄 요약
1. 구글의 지메일, 엄청난 규모의 사용자 때문에 공격자들의 갈망 대상.
2. 하지만 구글의 스팸 메일 차단 성공률은 99.9%에 달함. 0.1%가 큰 과제.
3. 구글은 자사가 개발한 텐서플로를 통해 이 0.1% 정복에 나섬.
[국제부 문가용 기자(globoan@boannews.com)]
Copyrighted 2015. UBM-Tech. 117153:0515BC
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>