다크웹 내 웹문서 10개 카테고리 분류모델 생성 및 학습데이터 공개해 다크웹 연구 공헌
[보안뉴스 김영명 기자] 데이터 인텔리전스 기업 S2W(에스투더블유, 대표 서상덕)는 이달 10일(일)부터 15일(금)까지 세계 최고 권위 자연어처리학회인 국제자연어처리학회(Natural Language Processing, NLP) 산하 ‘NAACL 2022’(Annual Conference of the North American Chapter of the Association for Computational Linguistics : 북미전산언어학학회)에 참가해 다크웹에서 사용되는 언어 분석 논문이 채택돼 구두 발표를 진행했다고 12일 밝혔다.
▲S2W가 NLP 산하 ‘북미전산언어학학회 2022’에 참가해 다크웹에서 사용되는 언어 분석 논문의 내용을 구두 발표하는 모습[사진=S2W]
S2W는 이번 학회에서 ‘다크웹의 언어 분석(Shedding New Light on the Language of the Dark Web)’ 논문을 발표했다. 특히, S2W의 논문은 다수의 논문 중에서도 그 가치를 인정받아 주요 세션의 하나인 ‘구두 발표’로 진행됐다. 해당 논문은 S2W와 KAIST(신승원 교수)가 공동 연구로 진행했다.
S2W는 이번 연구를 통해 다크웹 데이터를 수집 및 분석, 다크웹에서 사용되는 언어와 일반웹에서 사용되는 언어를 비교 분석해 언어 사용이 어떻게 다른지를 밝혀냈다. 또한, 다크웹의 웹 문서들을 10가지 카테고리로 분류하는 모델을 만들었으며, 이 분류 모델을 만드는데 사용한 학습 데이터를 공개해 다크웹 연구를 촉진하는데 공헌했다.
S2W R&D 연구소는 “다크웹에서만 사용되는 언어들을 면밀하게 분석할 수 있도록 방대한 데이터 분류, 체계화로 업계 관계자들이 지속해서 다크웹 언어를 연구하고 활용해 전문성을 높일 수 있게 됐다”고 말했다.
특히, S2W는 업계 대표 데이터 인텔리전스 기업으로서, 지속해서 연구개발 분야 인력 육성과 지원에 나서 큰 성과를 얻고 있다. S2W 연구진들은 이번 NAACL 학회 논문 발표만이 아니라 보안분야 세계 학회인 NDSS(2019)을 포함해 www(웹) 분야 학회에서 △가상화폐 분석 △다크웹 분석 피싱정보 수집 △해킹기법 분석 등에 대한 연구 결과물을 논문으로 발표하기도 했다.
서상덕 S2W 대표는 “이번 NAACL 성과는 S2W의 다크웹 언어 연구가 단순히 논문으로 끝나는 것이 아니”라며 “궁극적으로는 사이버 범죄를 사전에 예방하고 빠르게 대처할 수 있도록 해 안전한 세상을 만드는데 긍정적인 변화를 이끌고 있다는 점을 증명한 사례”라고 말했다. 이어 “앞으로도 S2W는 연구개발을 중심에 두고 적극적으로 글로벌 고객들과 만나 자사 보안 기술의 우수성을 알릴 것”이라며 “S2W의 글로벌 브랜드 인지도를 제고하는데도 주력할 계획”이라고 덧붙였다.
[김영명 기자(sw@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>