자동화 작업 및 사용자가 설정한 작업에 대해선 완벽
[보안뉴스 문가용] 머신 러닝에는 한 가지 문제가 있다. 바로 머신 러닝의 뜻이 무엇인지 제대로 알고 있는 사람이 거의 없다는 거다. 한 CEO는 사석에서 머신 러닝에 대해 “몇 년 전 모든 사람들이 무슨 뜻인지도 잘 모르고 ‘빅 데이터’를 입버릇처럼 말하던 게 생각난다”며 “차라리 그때가 나았던 건 빅 데이터는 설명하면 이해하기라도 쉬었지, 머신 러닝은 설명하기도, 이해하기도 모두 어렵기 때문이다”라고 말했다.
.jpg)
그렇다면 머신 러닝에 대한 가장 흔한 착각은 무엇일까? “모든 문제를 해결할 수 있는 마법 상자로 여기는 것”이라고 전문가들은 말한다. “머신 러닝이란 걸 데이터에 주문 걸 듯이 걸어두면 데이터가 알아서 스스로를 보호하고 올바른 사용자를 알아볼 수 있을 거라고 생각합니다. 그렇다고 그런 만화영화 같은 그림을 머릿속에 그리고 있진 않지만, 그런 비슷한 기대치를 가지고 있다는 거죠. 이런 개념으로 머신 러닝을 정보보안에 접목한다면 어떤 일이 일어날까요? 사람의 영향력이 떨어지고 많은 전문가들이 실업자 신세를 면치 못할 것입니다. 그리고 재앙이 일어나겠죠.”
아무리 머신 러닝이 차세대 보안 혁명의 가장 유력한 후보라고 해도 전문가와 대체할 수는 없다. 머신 러닝 혹은 인공지능이라는 건 애초부터 사람을 대체하기 위해 만들어진 게 아니니 대체할 수 있느니 없느니 논하는 것 자체가 우스운 일이다. 그렇다면 인공지능의 존재가치는 무엇인가, 물을 수 있다. 이런 종류의 똑똑한 기기나 생각하는 알고리즘의 목적은 사람을 돕는 데에 있다. 사람이 할 수는 있지만 시간이 엄청나게 걸리는 단순 업무들 등을 자동으로 처리해 사람이 보다 ‘사람다운’ 일을 할 수 있도록 해주는 것이라는 거다.
예를 들면 다음과 같다. 한 멀웨어 전문가가 프레임워크(Framework)라는 악명 높은 POS 멀웨어에 대한 분석글을 읽고 있다고 치자. 이 멀웨어는 DNS 프로토콜을 뚫고 데이터를 훔쳐가는, 대단히 악질적인 녀석이다. 읽다보니 전문가의 머릿속에 한 가지 상황이 가정될 수밖에 없다. ‘만약 우리 네트워크에 이 공격이 아주 천천히, 눈에 안 띄도록 조심스럽게 일어난다면 과연 감지가 가능할까?’ 그렇게 고민을 하고 여러 가지 가능성에 대해 머릿속에 그려보니 갑자기 ‘왜 그 동안 기업들이 해킹 탐지에 그토록 오랜 시간이 걸려야 했는지’ 이해가 가기 시작한다.
그래서 그 전문가는 머신 러닝 소프트웨어를 가지고 클라이언트단, 즉 POS와 매장 워크스테이션에서 오는 DNS 요청들을 꾸준하게 분석하도록 설정한다. 이때 정상의 DNS 요청이 어떤 것인 정의를 내려주고, 클라이언트에 대한 집단분석을 명령한다. 그러면 이 머신 러닝 소프트웨어는 전문가가 설정해놓은 범위 바깥에 있는 수많은 행동이나 징후들을 탐지하고 알린다. 즉, 사람이 할 수는 있지만 시간이 상당히 많이 걸리는 일, 기계로 하면 효율이 더 좋은 일에만 이 머신 러닝이 동원될 것이라는 것.
이는 다시 말해 자동화 업무를 끝내주게 잘 하는 알고리즘 비서를 옆에 하나 둘 수 있다는 뜻이다. 먹지도 자지도 쉬지도 않는 비서이며 시킨 일을 정확히 수행해내는 능력자이기도 하다. 그러면 한 사람당 비서 하나만 둘 수 있을까? 전혀 그렇지 않다. 업무나 상황에 따라 알고리즘을 여럿 ‘가르쳐’ 일을 시키는 것도 가능하다.
머신 러닝은 다재다능하다
이렇게 머신 러닝이란 ‘뇌’를 탑재한 비서들은 여러 가지 재주를 겸비하고 있다. 그것도 현대 데이터 과학에 기반을 둔, 보안 전문가에겐 반드시 필요한 재주다. 서버나 단말기, 엔드포인트, 애플리케이션에서 추출한 로그 데이터처럼 시간 기록이 남겨진 데이터를 정확히 모델링해 ‘정상 행동 범위’를 아주 정확하게 정할 수 있는가 하면 이 ‘정상 범위’ 바깥에 있는 것들을 식별하고, 그 심각성(이탈의 정도)도 꽤나 정확하게 계산하는 게 가능하다. 실제로 지금 시장에 ‘머신 러닝 비정상 행동 탐지 솔루션’과 비슷한 이름으로 나와 있는 제품들의 기능도 뜯어보면 이와 대동소이하다.
게다가 이 머신 러닝이라는 것도 계속해서 발전해가기 마련인지라, 더 최신 제품들에는 추가적인 기능들이 있는데 이런 제품들은 ‘수석 비서’들과 같아서 보다 노련하고 정확한 결과물들을 사용자(보안 전문가)에게 전달한다. 이 수석 비서들이 할 수 있는 일에는 영향 분석, 데이터끼리 서로 이어 붙여서 또 다른 정보 찾기, 이유 찾기, 예보하기 등이 있다. 보안 전문가로서는 컨텍스트가 풍부해지는 것이라고 볼 수 있다.
보안의 큰 희망? 글쎄...
2015년 4월 엔터프라이즈 매니지먼트 어소시에이츠(Enterprise Management Associates)에서 진행한 설문 결과가 흥미롭다. 정보보안의 여러 가지 기술들 중 가장 ‘시급히 필요한 기술’에 ‘분석력’이 꼽혔기 때문이다. 분석이란 건 기기나 알고리즘이 할 수 없는 일이다. 물론 분석을 위한 자료를 생성해낼 수는 있겠지만, 그 자료를 해석하는 데에는 ‘통찰력’이란 것이 반드시 필요하기 때문이다.
그래서 드론이 헬리콥터 파일럿들의 일자리를 뺏어간다고 하고 보안업계에도 머신 러닝이라는 기똥찬 알고리즘이 나온다고 해도 보안 전문가들은 별로 위기감을 느끼지 않는다. 느낄 이유도 없다. 머신 러닝은 아직까지는 사람이 하는 일을 좀 더 편하게 해주는 역할만을 수행하고 있기 때문이다. 사람의 개입이나 가르침 없이, 독립하여 자생할 수 있는 머신 러닝 알고리즘은 존재하지 않는다.
글 : 마이크 파켓(Mike Paquette)

Copyrighted 2015. UBM-Tech. 117153:0515BC
[국제부 문가용 기자(globoan@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>