[보안뉴스 한세희 기자] 자율주행 차량을 위한 AI 학습 데이터를 학계와 산업계가 쉽게 구축하고 공유할 수 있게 된다.
과학기술정보통신부(부총리 겸 장관 배경훈)는 자율주행 인공지능(AI) 개발에 필요한 학습데이터를 국내 산학연이 함께 구축하고 쉽게 공유하도록 지원하는 ‘자율주행 E2E 데이터 구축 가이드라인 및 규격 정의서’를 발간했다고 19일 밝혔다.

[출처: gettyimagesbank]
자율주행 패러다임이 대규모 데이터를 학습한 하나의 AI가 인지, 판단, 제어를 통합 수행하는 ‘엔드투엔드’(E2E) 방식으로 전환하는 추세에 대응하기 위해서다. 이 방식은 막대한 양의 학습 데이터가 필수적이라 웨이모나 바이두 같은 글로벌 선도 기업들도 실증 거리를 확대하며 학습데이터 구축량을 늘리는데 주력하고 있다.
반면 국내에선 대규모 데이터를 확보하지 못해 E2E 방식 기술 개발에 병목이 되고 있다. 자율주행 학습데이터를 기업이나 기관이 개별 구축하고 있고, 차종에 따라 센서 위치가 다를 경우 학습데이터 공유가 어렵기 때문이다.
이에 과기정통부는 학습데이터 공유·활용을 극대화하고 기술 동향 변화에 빠르게 대응하기 위해 이 가이드라인을 개발했다.
가이드라인은 자율주행 E2E AI 학습 데이터 전 주기를 포괄한다. 데이터 수집, 가공, 정합·보정, 라벨링 등 자율주행 E2E 학습데이터 구축 절차를 정의하고 센서 구성과 저장 포맷 등 수집 시스템 요구사항과 수집된 원시데이터의 검증 방법을 제시한다. 또 시나리오 선별 등 데이터 가공, 위치 보정, 공간 정합 등 정합·보정 방법, 라벨링 항목과 라벨링을 통해 생성되는 학습데이터 셋 규격 등 라벨링 방법 등을 정리했다.
이 가이드라인은 범부처 자율주행 R&D 사업 과제를 통해 개발됐으며, 자율주행기술개발혁신사업단 홈페이지(www.kadif.kr)에서 확인할 수 있다.
박태완 과기정통부 정보통신산업정책관은 “이 가이드라인을 통해 공동 활용 가능한 자율주행 데이터 체계가 구축되고, 고품질 데이터 기반의 자율주행 기술력을 확보할 수 있는 토대가 마련됐다”고 밝혔다.
[한세희 기자(hahn@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>














