“단순 성능 비교를 넘어, 국내외 AI 신뢰성 생태계 선도할 것”
[보안뉴스 조재호 기자] 한국지능정보사회진흥원(NIA)과 과학기술정보통신부는 인공지능(AI) 모델의 안정성 및 신뢰성 평가 기반 구축을 위한 ‘LLM 안정성 및 신뢰성 평가 데이터셋 구축’ 사업 착수보고회를 개최했다고 8일 밝혔다.

▲LLM 안정성 및 신뢰성 평가 데이터 구축 사업 착수보고회 참석자들이 기념촬영을 하고 있다. [자료: NIA]
이 사업은 NIA와 과기정통부가 추진 중인 ‘독자 AI 파운데이션 모델 프로젝트’를 통해 구축되는 AI 모델 등에 대한 안전성과 신뢰성을 평가하기 위한 기반을 마련하는 것으로, AI 모델의 위험 요소에 대한 체계적이고 정량적인 검증 체계를 구축하는 것을 목표로 한다.
NIA는 이번 사업을 통해 AI 모델의 성능 평가를 넘어 안정성과 신뢰성을 아우른 종합적인 AI 평가 체계를 구축하며, 글로벌 AI 거버넌스 논의에서 한국의 위상을 높이는 역할을 담당한다. 또, 사이버보안과 AI 자율성, 사실 기반의 정확성, 가치 편향 등 AI 안정성과 신뢰성 핵심 항목에 기반한 한국어 특화 벤치마크 데이터셋을 구축하고, 글로벌 기준에 부합한 AI 모델 평가 체계로 발전시킬 예정이다.
이날 착수보호회는 과기정통부를 비롯해 NIA와 데이터셋 구축을 수행할 인공지능안전연구소 관계자가 참석해 데이터 구축 방향과 평가 체계 설계, 글로벌 연계 전략등을 논의했다.
김명주 인공지능안전연구소장은 “이번 사업은 단순 성능 비교를 넘어, AI가 우리 사회에서 신뢰받으며 활용될 기준을 세우는 첫 시도”라며 “공정하고 객관적인 평가 체계를 만들어 국내외 AI 신뢰성 생태계를 선도해 나가겠다”고 말했다.
황종성 NIA 원장은 “AI 안전성 평가는 선택이 아닌 필수인 시대”라며 “AI 허브를 통해 축적한 1300여종의 AI 학습데이터와 평가 체계 전문성을 총동원해 세계 최고 수준의 AI 안전성 검증 체계를 구축하고, 글로벌 AI 신뢰성 표준을 선도할 것”이라고 강조했다.
[조재호 기자(sw@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>