미토스, GPT-5.5 성능은 더 탁월... AI 기반 사이버 공격 대비해야
[보안뉴스 한세희 기자] 첨단 AI 모델이 실행 가능한 사이버 공격의 길이가 4.7개월마다 두배씩 증가하고 있다고 영국 인공지능보안연구소(AISI)가 밝혔다.
이는 2025년 11월 추정한 8개월에 비해 두배 가까이 빨라진 속도이며, 이후 테스트한 앤트로픽 클로드 미토스와 오픈AI GPT-5.5는 더 빠른 사이버 공격 속도를 보여준다고 AISI는 밝혔다.

▲AISI 사이버보안 시간 지평 추이 [출처: AISI]
AISI는 최신 AI 모델의 사이버 공격 역량 향상 속도를 추적 조사한 자료를 바탕으로 정부의 AI 관련 정책 결정을 지원하는 연구를 해 왔다.
AISI는 AI가 수행할 수 있는 다양한 사이버 보안 관련 작업들의 길이를 인간 전문가의 성과와 비교하는 ‘사이버 시간 지평’(Cyber Time Horizons) 테스트를 실시했다. 시간 경과에 따른 비교를 가능하게 하기 위해 작업당 토큰 수는 250만개로 제한했다.
2월 기준, 토큰이 250만개로 제한된 상황에서 2024년 말 이후 등장한 최첨단 모델들이 인간 전문가가 성공적으로 해 낸 작업에서 80% 이상 성공하는 사이버 시간 지평 시간이 4.7개월마다 2배씩 늘어난 것으로 AISI는 추산했다.
또 이후 테스트한 미토스와 GPT-5.5는 이런 추세를 더욱 크게 앞선 성능을 보인 것으로 나타났다. AISI가 가진 제한된 사이버 보안 과제들의 경우, 두 AI 모델은 250만 토큰 제한이 있는 상황에서도 100% 가까운 성공률을 보였다.
다만, 미토스와 GPT-5.5가 예외적으로 좋은 성능을 보인 것인지 또는 앞서 나타난 전반적 발전 속도 증가 추세에 부합하는 것인지는 현재로선 판단하기 어렵다는 입장이다.
250만 토큰 제한을 풀 경우 성공률이 너무 높아져 사이버 시간 지평 측정 자체가 불가능하다고 연구소는 밝혔다.
미토스와 GPT-5.5 연구 과정에서 이들이 자율적으로 보안 취약점을 찾아내 공격을 실행할 수 있음을 보여주는 증거도 나왔다.
미토스는 AISI의 사이버 훈련장에 해당하는 ‘라스트 원즈’(The Last Ones)에서 10번 중 6번 문제를 해결했다. 과거 실패했던 산업시스템 공격 훈련장 ‘냉각 탑’(Cooling Tower)에선 10번 중 3번 성공했다. AI 모델이 냉각 탑 과제에 성공한 것은 이번이 처음이다. GPT-5.5는 라스트 원즈 과제를 10번 중 3번 성공했다.
이번 연구에선 AISI가 이전 보고서에서 테스트한 미토스 프리뷰의 새 버전을 활용했다. 완전히 새로운 모델이 아니라 같은 모델에서 약간만 개선한 버전도 큰 성능 향상을 이룰 수 있음을 보여준다.
다만, 성능 측정에 사용된 벤치마크는 실제 성능을 완전히 반영하긴 어려운 불완전함을 갖고 있음을 염두에 둬야 한다고 연구소는 밝혔다.
[한세희 기자(hahn@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>














