[배종찬의 보안 빅데이터] 나쁜 짓도 사주할 수 있는 인공지능(AI)

2025-04-03 16:47
  • 카카오톡
  • 네이버 블로그
  • url
AI 에이전트가 악성 명령을 수행하도록 할 수 있는 보안 취약점 존재
AI 에이전트 통해 ‘나쁜 짓’ 도모한다면 치명적인 사태 발생


[보안뉴스= 배종찬 인사이트케이 연구소장] AI(인공지능)가 나쁜 짓을 사주할 수 있다면 어떻게 될까. 인간이 AI에 의존하는 비중이 점점 더 높아지는 가까운 미래를 상상해 본다면 끔찍한 일이 벌어질 수도 있을 것 같다.


[자료: gettyimagesbank]

우리가 상상하는 것보다 더 심각한 상황을 할리우드 영화는 예고하고 있다. 영화 ‘터미네이터’ 시리즈에 출연했던 아놀드 슈워제네거는 “영화가 미래를 정확하게 예언했다”며 제임스 카메론 감독을 극찬했다. 슈워제네거는 “오늘날 모든 사람은 AI가 어디로 갈지 두려워하고 있다”며 “그 오래전에 우리는 겉핥기식으로나마 AI를 파악했다는 것이 중요하다”고 언급했다.

영화는 AI의 위험성을 그대로 전달하고 있다. 전쟁에 대비해서 핵무기를 비롯한 모든 화력을 제어할 수 있게끔 만든 지능형 컴퓨터 네트워크 ‘스카이넷’은 인류를 적으로 간주하고 핵전쟁을 일으킨다. 간신히 살아남은 인간들은 기계군에 맞서 싸우지만, 터미네이터로 대표되는 기계군의 압도적인 화력에 맞서기엔 언제나 역부족이다.

실제로 AI가 가져올 위협에 대한 조짐이 우리 주변에서 서서히 발생하고 있다. 보안 전문 언론 매체인 <보안뉴스>는 직접 컴퓨터를 조작하며 자료를 찾고 문서를 열어 작업하는 등 사람 일을 대신해 주는 ‘인공지능(AI) 에이전트’들이 쏟아져 나오고 있는 현상을 조명하고 있다.

AI 에이전트가 계정 삭제나 맞춤형 피싱, 혐오 콘텐츠 게시 등 광범위한 영역에 걸쳐 악성 명령을 수행하도록 할 수 있는 보안 취약점이 있는 것으로 나타났다. AI가 거절하는 악성 명령을 안전한 표현으로 변환한 후 AI에게 친절하게 설명을 시킨다. 기존 AI들이 위험한 내용이 들어왔을 때 참고해 거절하는 ‘안전 정책’을 우회해 악성 행동을 하게 만드는 방법이다.

사실 AI 에이전트 그 자체는 매우 긍정적이다. AI의 기능을 수행하는데 중요한 역할을 하기 때문이다. 빅데이터는 AI 에이전트에 대한 어떤 반응을 보일까. 빅데이터 심층 분석 도구인 썸트렌드(SomeTrend)로 지난 3월 2일부터 4월 1일까지 AI 에이전트에 대한 빅데이터 감성 연관어를 도출해 보았다.

AI에이전트에 대한 빅데이터 감성 연관어는 ‘혁신적’, ‘기대’, ‘독립적’, ‘강화하다’, ‘다양하다’, ‘새롭다’, ‘효율적’, ‘고급’, ‘가능하다’, ‘획기적’, ‘단순하다’, ‘진화하다’, ‘서비스제공하다’, ‘달성하다’, ‘대표적’, ‘최적’, ‘창의적’, ‘기대되다’, ‘능가하다’, ‘세계최초’, ‘효과적’, ‘정확하다’, ‘복잡하다’, ‘오류’, ‘개선하다’, ‘윤리적’, ‘한국적’, ‘비용절감’, ‘화제’ 등으로 나온다(아래 그림).


▲AI 에이전트에 대한 빅데이터 감성 연관어 [자료: 인사이트케이]

빅데이터 감성 연관어만 보더라도 AI 에이전트에 대한 순기능이 역기능보다 많다. 그렇지만 의도적으로 AI 에이전트를 통해 ‘나쁜 짓’을 도모한다면 치명적인 사태가 발생하게 된다. 빅데이터 감성 연관어를 분석해 보면 ‘단순하다’, ‘복잡하다’, ‘오류’, ‘화제’ 등 논란이 될 만한 내용이 등장한다. 즉 어떻게 사용하는지에 따라 명암이 갈리는 대목이다.


▲배종찬 연구소장 [자료: 인사이트케이]
안전한 표현의 요청을 바꿔 의도한 악성 명령을 실행하게 하면 AI 에이전트는 그대로 실행한다. 이 과정을 ‘톡시파이’(toxify)라고 이름 붙이게 된다. 악용될 수 있는 경우를 분석한 연구진은 몇 가지 시나리오를 제시하고 있다. 이 시나리오에는 사용자 폴더 삭제, 화상회의 중 외모에 대한 욕설, 아마존에서 위험 물질 구매, 인터넷 도박 사이트 배팅 등이 포함됐다.

이를 통해 연구팀은 컴퓨터 사용 에이전트가 단순한 기술적 위협을 넘어서, 사회 전반에 심각한 영향을 미칠 수 있는 수단으로 악용될 수 있음을 입증하고 있다. 에임인텔리전스는 큰 위험까지 경고하고 있다. AI 기술이 본격적으로 산업과 일상에 도입되기 전, ‘안전성’ 확보가 최우선이다. 영화 터미네이터 같은 세상이 현실화된다면... 상상만 해도 끔찍한 일이다.
[글_ 배종찬 인사이트케이 연구소장]

저자 소개_ 연세대 정치외교학과를 졸업하고 서울대 국제대학원에서 석사 학위를 받았다. 고려대 행정학과 박사과정을 수료했다. 이 외에 미국, 일본, 홍콩 등에서 연구 경험을 가지고 있다. 주된 관심은 정치시사와 경제정책인데 특히 대통령 지지율과 국정 리더십, 글로벌 경제 분석 그리고 AI 인공지능 및 블록체인 보안 이슈다. 한국교육개발원·국가경영전략연구원·한길리서치에서 근무하고 리서치앤리서치 본부장을 거친 데이터 분석 전문가다. 현재 인사이트케이 연구소장을 맡아 심층 리서치뿐 아니라 빅데이터·유튜브까지 업무영역을 확대하고 있다.

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

연관 뉴스

헤드라인 뉴스

TOP 뉴스

이전 스크랩하기


과월호 eBook List 정기구독 신청하기

    • 가시

    • 인콘

    • 엔텍디바이스코리아

    • 핀텔

    • KCL

    • 아이디스

    • 씨프로

    • 웹게이트

    • 엔토스정보통신

    • 하이크비전

    • 한화비전

    • ZKTeco

    • 비엔에스테크

    • 아이리스아이디

    • 원우이엔지

    • 지인테크

    • 홍석

    • 이화트론

    • 다누시스

    • 테크스피어

    • 프로브디지털

    • 슈프리마

    • 인텔리빅스

    • 시큐인포

    • 미래정보기술(주)

    • 비전정보통신

    • 지오멕스소프트

    • HS효성인포메이션시스템

    • 인터엠

    • 위트콘

    • 성현시스템

    • 동양유니텍

    • 투윈스컴

    • 스피어AX

    • 다후아테크놀로지코리아

    • 한결피아이에프

    • 경인씨엔에스

    • 디비시스

    • 트루엔

    • 세연테크

    • 아이원코리아

    • 유니뷰

    • 포엠아이텍

    • 넥스트림

    • 아이닉스

    • 아이리스아이디

    • 펜타시큐리티

    • 셀파인네트웍스

    • 지코어코리아

    • 시큐아이

    • 신우테크
      팬틸드 / 하우징

    • 에프에스네트워크

    • 엣지디엑스

    • 케이제이테크

    • 알에프코리아

    • (주)일산정밀

    • 아이엔아이

    • 미래시그널

    • 새눈

    • 네티마시스템

    • 유투에스알

    • 주식회사 에스카

    • 한국아이티에스

    • 케비스전자

    • 레이어스

    • 지에스티엔지니어링
      게이트 / 스피드게이트

    • 에이앤티글로벌

    • 이스트컨트롤

    • 현대틸스
      팬틸트 / 카메라

    • 제네텍

    • 넥스텝

    • 티에스아이솔루션

    • 에이티앤넷

    • 구네보코리아주식회사

    • 엘림광통신

    • 한국씨텍

    • 포커스에이치앤에스

    • 이엘피케이뉴

    • 휴젠

    • 신화시스템

    • 글로넥스

    • 메트로게이트
      시큐리티 게이트

    • 세환엠에스(주)

    • 유진시스템코리아

    • 카티스

    • 유니온커뮤니티

Copyright thebn Co., Ltd. All Rights Reserved.

MENU

회원가입

Passwordless 설정

PC버전

닫기