케이사인, 악성코드 분야 AI 데이터셋 4억 건 구축

2022-02-11 09:42
  • 카카오톡
  • 네이버 블로그
  • url
국내외 최고 페타바이트 수준의 데이터셋
K-사이버 방역체계의 일환 ‘사이버보안 AI 학습용 데이터셋’ 최초 구축


[보안뉴스 원병철 기자] 정보보안 전문업체 케이사인(대표 최승락)이 자회사 위협 인텔리전스 전문기업인 샌즈랩 및 안티바이러스 전문기업인 이스트시큐리티와 4억 건의 사이버보안 AI 학습용 데이터셋 구축을 완료했다고 11일 밝혔다.


▲신대균 케이사인 프로젝트 매니저[사진=케이사인]

코로나19로 보안위협 패러다임이 빠르게 변화하고 있으며, 기업과 조직의 업무 환경이 비대면 방식으로 이루어지고 있다. 사이버 공격이 지능화되고, 급증하면서 보안의 중요성이 그 어느 때보다 중요한 이슈로 떠오르고 있다.

한국인터넷진흥원(KISA)은 지난해에 과학기술정통부의 ‘K-사이버방역 추진전략’의 일환으로 ‘사이버보안 AI 데이터셋 구축사업’을 진행했다. 이 사업은 사이버 침해대응 분야 민관 전문가가 협력해 사이버보안 AI 데이터셋 구축의 선순환 환경을 조성하고, 국내 보안기술을 지능화해 급증하는 신·변종 보안 위협에 선제적으로 대응할 수 있는 기반을 마련하는 것을 목표로 한다.

케이사인 컨소시엄은 해당 사업에서 3억 건 이상의 정상/악성파일 및 300종 이상의 악성코드 패밀리를 분류하고, 즉시 활용할 수 있는 ‘사이버보안 인공지능(AI) 데이터셋(악성코드 분야)’을 구축했다. 악성코드 AI 특징정보 추출에 대한 전문적 노하우와 클라우드 기반의 페타급 대용량 데이터셋 이관 방법론으로 최적의 데이터셋을 구축하고, 이관 및 검증 체계를 마련하며 업계의 주목을 받았다. 케이사인 컨소시엄은 샌즈랩에서 운영하는 멀웨어즈닷컴에서 분석한 20억 건의 악성코드 분석 데이터 가운데 대표성을 띈 3억개의 악성코드를 추출하고, 악성코드 특징 정보를 바탕으로 300여 종의 패밀리로 분류했다.


▲진단명 기반, 속성 기반 데이터셋의 메타데이터 생성 도구 정확성 확인[자료=케이사인]

구축된 데이터셋은 총 150여종의 메타정보 및 원시데이터를 포함한다. 또한 공격그룹, 공격기법, 유포방법 등 악성코드 속성정보에 대한 고차원으로 연관관계 분석을 실시해 1억건의 악성코드 분석 데이터도 함께 마련했다. 정적/동적 분석만으로 도출할 수 없는 심층정보를 속성으로 생성해 유사도 분석을 수행하고, 클러스터링 한 결과를 기반으로 데이터셋을 구축하며 기술을 우수성을 인정받았다. 구축한 데이터셋은 다수의 기관으로부터 다양한 AI 모델을 통해 실증을 수행했다. 또한 악성코드 전문 인력과 품질 검증을 위해 각 분야 전문가 10인의 자문을 받아 데이터셋의 질적 향상을 도모했다.

이번 사업의 총괄을 맡은 신대균 케이사인 프로젝트 매니저는 “규모가 작은 중소기업의 경우, 노하우와 자원 부족으로 악성코드 관련 메타 데이터를 추출해내기 어렵다”며, “한국인터넷진흥원과 케이사인 컨소시엄의 노력으로 국내 사이버 보안산업 전반에 활용할 수 있는 악성코드 관련 핵심 데이터셋을 성공적으로 구축하게 돼 뜻깊다”고 밝혔다.

케이사인 측은 사업 종료 이후에도 구축된 데이터셋을 인공지능 핵심기술 연구 개발에 사용하는 한편, 사이버 보안 위협 대응에 필요한 중요 거점 데이터셋으로 활용이 될 수 있도록 지원할 방침이다. 또한, ‘사이버보안 AI 학습용 데이터셋’은 한국인터넷진흥원 사이버보안빅데이터센터를 통해 민간에 개방될 예정이다. 비전문가 집단도 인공지능 모델을 만들어 시험할 수 있는 이미지와 그램데이터 등 악성코드에서 추출한 다양한 메타 데이터와 MITRE ATT&CK T-ID 매핑 등 글로벌 트렌드에 맞춘 최신 데이터셋이 포함돼있다.
[원병철 기자(boanone@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

헤드라인 뉴스

TOP 뉴스

이전 스크랩하기


과월호 eBook List 정기구독 신청하기

    • 씨프로

    • 인콘

    • 엔텍디바이스코리아

    • 핀텔

    • 아이비젼

    • 아이디스

    • 씨프로

    • 웹게이트

    • 엔토스정보통신

    • 하이크비전

    • 한화비전

    • ZKTeco

    • 비엔에스테크

    • 지오멕스소프트

    • 원우이엔지

    • 지인테크

    • 홍석

    • 이화트론

    • 다누시스

    • 테크스피어

    • TVT코리아

    • 슈프리마

    • 인텔리빅스

    • 시큐인포

    • 미래정보기술(주)

    • 세연테크

    • 비전정보통신

    • 트루엔

    • 경인씨엔에스

    • 한국씨텍

    • 성현시스템

    • 아이원코리아

    • 프로브디지털

    • 위트콘

    • 다후아테크놀로지코리아

    • 한결피아이에프

    • 스피어AX

    • 동양유니텍

    • 포엠아이텍

    • 넥스트림

    • 펜타시큐리티

    • 에프에스네트워크

    • 신우테크
      팬틸드 / 하우징

    • 옥타코

    • 네이즈

    • 케이제이테크

    • 셀링스시스템

    • 네티마시스템

    • 아이엔아이

    • 미래시그널

    • 엣지디엑스

    • 인빅

    • 유투에스알

    • 제네텍

    • 주식회사 에스카

    • 솔디아

    • 지에스티엔지니어링
      게이트 / 스피드게이트

    • 새눈

    • 에이앤티글로벌

    • 케비스전자

    • 한국아이티에스

    • 이엘피케이뉴

    • (주)일산정밀

    • 구네보코리아주식회사

    • 레이어스

    • 창성에이스산업

    • 엘림광통신

    • 에이앤티코리아

    • 엔에스티정보통신

    • 와이즈콘

    • 현대틸스
      팬틸트 / 카메라

    • 엔시드

    • 포커스에이아이

    • 넥스텝

    • 인더스비젼

    • 메트로게이트
      시큐리티 게이트

    • 엠스톤

    • 글로넥스

    • 유진시스템코리아

    • 카티스

    • 세환엠에스(주)

Copyright thebn Co., Ltd. All Rights Reserved.

시큐리티월드

IP NEWS

회원가입

Passwordless 설정

PC버전

닫기