멀웨어 탐지에 천리안이라는 ‘머신러닝’ 기술

2015-08-01 08:50
  • 카카오톡
  • 네이버 블로그
  • url

샌드박스보다 효율적인 멀웨어 감지 방법 등장 기존의 기술에서 한 단계 더 들어가 ‘딥 러닝’

[보안뉴스 주소형] ‘머신러닝’ 시대의 서막이 올랐다. 머신러닝은 빅데이터를 유용한 정보로 바꿔주는 개념의 기술인데 이를 멀웨어 탐지에도 도입하자는 목소리가 높아지고 있다. 멀웨어 탐지에 머신러닝 기술을 활용하게 되면 10분의 1초 내에 코드가 멀웨어인지 아닌지를 판단할 수 있다. 뿐만 아니라 굳이 보호된 영역 내에서 프로그램을 작동시키는 샌드박스(sandbox) 기술을 사용하여 정보의 제한을 받을 필요가 없어지기 때문이다. 


  ▲ 더 멀리 선명하게 볼 수 있는 ‘머신러닝’이라는 안경 장착


기존 기술에서 한 단계 더 진화했다는 의미에서 ‘딥 러닝(Deep Learning)’이라고 불리기도 하는 머신러닝은 잘만 활용하면 앞서 말한 빠른 코드분석은 물론 궁극적으로는 멀웨어 감염을 차단하는 효과까지 기대해볼만 하다고 전문가들은 입을 모은다. 

미국 보안기업인 사일런스(Cylance)의 맷 울프(Matt Wolff) 수석 데이터 사이언티스트(Chief Data Scientist, CDS)는 머신러닝에서 좀 더 세분화된 딥 러닝을 멀웨어 감지에 적용하고 있다고 말했다. 소프트웨어가 정상적인 파일과 악성 파일을 구분할 수 있도록 훈련시켜 애플리케이션/알고리즘을 만들어 내는 것이라고 설명했다. 이로 인해 예전에는 찾을 수 없었던 범위의 멀웨어까지 발견할 수 있게 된다는 것.

또한 해당 소프트웨어는 정적분석(Static Analysis)을 사용하고 있다. 멀웨어를 감지하기 위한 테스트를 실시하면서 멀웨어가 작동될 수 있다는 리스크를 배제하기 위해서다. “멀웨어가 작동될 수 있는 조금의 여지도 주지 않고 있다. 그렇다보니 속도도 빠를 수밖에 없어 기존의 샌드박싱이나 멀웨어 분석보다 휠씬 빠르다”라고 말했다.
사실 머신러닝이나 딥 러닝을 멀웨어 탐지에 활용하는 것은 이번이 처음은 아니다. 하지만 구상 수준에 지나지 않았던 몇 년 전에 비해 더욱 현실화된 것이다. 가격적으로 살펴봐도 클라우드 기반의 컴퓨팅 옵션으로 인해 빅데이터 컴퓨팅 대비 경제적이다. 굳이 수백 개의 머신이 필요한 데이터 센터를 설립할 필요가 없다는 것이다. 이제는 그때그때 필요한 머신러닝 프로세싱 파워만 조달받으면 된다. “프로세서와 메모리 등을 강화하는 것이 기술에 힘을 실어주는 것”이라며 “아직까지 아무도 멀웨어 탐지에 알고리즘을 적용하는 것 자체를 생각해내지 못하고 있는 상황으로 파악하고 있다.” 

“머신러닝의 가장 큰 특징은 패턴을 발견하는 일이다. 멀웨어 하나만 놓고 봤을 때는 절대 큰 그림의 패턴을 볼 수 없다. 하지만 멀웨어 샘플이 10억 개 이상 쌓이게 될 경우 전에 보이지 않았던 것들이 보이고 이를 통해 패턴을 찾을 수 있다. 이것이 바로 머신러닝의 최종적인 목표고 힘이다.”

예를 들어 우리가 현재까지 파악하고 있는 멀웨어 패턴의 경우 캡처 및 키스트로크(keystrokes) 저장하는 기능을 활용하는 것이다.

이 같은 멀웨어들의 번식을 막는 데 머신러닝 및 딥 러닝이 많은 도움이 될 것으로 예상된다. “보통 멀웨어 제작자가 멀웨어를 하나 만들어내고 그에 따른 새로운 변종을 만들어 내는 데 2달 정도가 소요된다. 그런데 머신러닝 모듈을 사용하면 선제적으로 예상하고 감지할 수 있다.”

매일매일 만들어지는 멀웨어들이 쌓여 멀웨어는 잡아내는 데 더욱 체계화되고 지능적인 방법이 만들어진다. 사일런스사는 200만 GB에 달하는 정보를 머신러닝에 도입하는 시스템을 구축하고 있다. “우리는 몇 백 개의 CPU들을 며칠간 가동시키고 이들을 몇주 나아가 몇 달간 연구하여 필요한 정보들을 축척하고 있다. 물론 이를 위해서는 수백개의 기가바이트 메모리를 가동시키는 CPU와 ‘빅 머신(big machines)’을 필요하다”고 울프 CDS는 말했다.  

이러한 머신러닝 기술을 감지 시스템에 도입하여 새로운 악성코드 발견을 견인한다는 것이 이들의 목표다. 이는 현존하는 모든 감지 툴의 자리를 차지하게 될 것이라는 전망도 했다. “시그리처 기반의 엔진 대비 머신러닝 엔진이 모든 면에서 효율적이다.”
 

한편 사일런스사의 울프 CDS와 앤드류 데이비스(Andrew Davis)는 블랙햇 2015에서 멀웨어 감지를 위한 머신러닝 모듈을 선보일 계획이다.
Copyrighted 2015. UBM-Tech. 117153:0515BC
[국제부 주소형 기자(sochu@boannews.com)]

<저작권자: 보안뉴스(http://www.boannews.com/) 무단전재-재배포금지>

헤드라인 뉴스

TOP 뉴스

이전 스크랩하기


과월호 eBook List 정기구독 신청하기

    • 다후아테크놀로지코리아

    • 인콘

    • 엔텍디바이스코리아

    • 이노뎁

    • 다후아테크놀로지코리아

    • 아이디스

    • 씨프로

    • 웹게이트

    • 씨게이트

    • 하이크비전

    • 한화비전

    • ZKTeco

    • 비엔에스테크

    • 비엔비상사

    • 원우이엔지

    • 지인테크

    • 지오멕스소프트

    • 이화트론

    • 다누시스

    • 테크스피어

    • 렉스젠

    • 슈프리마

    • 인텔리빅스

    • 시큐인포

    • 미래정보기술(주)

    • 동양유니텍

    • 비전정보통신

    • 경인씨엔에스

    • 트루엔

    • 성현시스템

    • 한결피아이에프

    • 프로브디지털

    • 디비시스

    • 세연테크

    • 스피어AX

    • 투윈스컴

    • 위트콘

    • 유에치디프로

    • 구네보코리아주식회사

    • 주식회사 에스카

    • 넥스트림

    • 포엠아이텍

    • 세렉스

    • 신우테크
      팬틸드 / 하우징

    • 에프에스네트워크

    • 유투에스알

    • 케이제이테크

    • 알에프코리아

    • 창성에이스산업

    • 아이엔아이

    • 미래시그널

    • 새눈

    • 에스에스티랩

    • 현대틸스
      팬틸트 / 카메라

    • 이스트컨트롤

    • 네티마시스템

    • 태정이엔지

    • (주)일산정밀

    • 넥스텝

    • 한국씨텍

    • 두레옵트로닉스

    • 에이티앤넷

    • 지에스티엔지니어링
      게이트 / 스피드게이트

    • 에이앤티글로벌

    • 포커스에이치앤에스

    • 신화시스템

    • 휴젠

    • 메트로게이트
      시큐리티 게이트

    • 글로넥스

    • 엘림광통신

    • 세환엠에스(주)

    • 유진시스템코리아

    • 카티스

    • 유니온커뮤니티

Copyright thebn Co., Ltd. All Rights Reserved.

MENU

회원가입

Passwordless 설정

PC버전

닫기