LG, 국제 AI 학회서 이미지 설명하는 ‘캡셔닝 AI’ 첫 공개

2023-06-20 11:09
  • 카카오톡
  • 네이버 블로그
  • url
세계 최대 컴퓨터 비전 학회 CVPR서 이미지 캡션과 키워드 생성하는 ‘캡셔닝 AI’ 공개

[보안뉴스 박미영 기자] LG AI연구원이 지난 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 ‘CVPR(Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식) 2023’에서 이미지 검색 시장에 변화를 가져올 ‘캡셔닝 AI(Captioning AI)’를 처음 공개했다.


[사진=LG]

LG AI연구원이 처음으로 외부에 공개한 ‘생성형 AI’ 상용화 서비스인 ‘캡셔닝 AI’는 ‘인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI’로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다.

LG AI연구원은 AI가 인간처럼 처음 보는 물체나 장면에 대해서도 이전의 경험과 지식을 활용해 이해하고 설명할 수 있도록 ‘제로샷 이미지 캡셔닝(Zero-shot Image Captioning)’ 기술을 적용했다.

‘제로샷 이미지 캡셔닝’은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경·인물·행동 등 이미지상의 다양한 요소와 특징을 인식하고, 그 관계를 이해하고 설명할 수 있게 하는 기술이다.

‘캡셔닝 AI’는 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있다. ‘캡셔닝 AI’는 문장이나 단어의 길이와 개수에 따라 다르지만 평균적으로 5개 문장과 10개의 키워드를 10초 내에 생성한다. 이미지 범위를 1만장으로 확장하면 2일 이내에 작업을 끝낼 수 있어 빠른 시간 내에 맞춤형 이미지 검색·관리 시스템 구축이 가능하다.

‘캡셔닝 AI’는 LG AI연구원과 셔터스톡(Shutterstock)의 긴밀한 협력이 있어 가능했다. 셔터스톡은 이미지와 영상 등 시각 콘텐츠가 매일 수십만개 이상 새롭게 추가되는 세계 최대 플랫폼 기업으로, 콘텐츠를 분석하고 처리하는 경험이 풍부한 전문가들이 포진해 있다.

LG AI연구원은 이미지 분류와 검색에 활용하기 적합한 문장의 길이나 표현 방법 등 이미지 캡셔닝에 관한 방대한 노하우를 가지고 있는 셔터스톡과 데이터 학습부터 서비스 개발까지 함께해 완성도를 높였다.

특히, LG AI연구원과 셔터스톡은 실용적이면서도 신뢰할 수 있는 AI 모델 개발을 위해 학습 데이터의 편향성·선정성 등 AI 윤리 검증을 진행하고, 저작권 투명성도 확보했다.

세잘 아민 셔터스톡 CTO는 “현재 글로벌 고객사 10곳을 대상으로 ‘얼리 액세스(앞서 해보기) 프로그램’을 진행하며 캡셔닝 AI 기술을 발전시켜 나가고 있다”며, “캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것”이라고 강조했다.

LG AI연구원은 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 ‘캡셔닝 AI’ 서비스를 시연할 계획이다. LG AI연구원은 이날 ‘캡셔닝 AI’의 기반 기술인 ‘제로샷 이미지 캡셔닝’을 주제로 서울대 AI대학원, 셔터스톡과 함께 워크숍도 진행했다.

이경무 서울대 석좌교수의 개회사로 시작한 워크숍에는 LG AI연구원의 최고 AI 사이언티스트(CSAI, Chief Scientist of AI)인 이홍락 미시간대 교수를 비롯해 코르델리아 슈미드(프랑스 국립 컴퓨터 과학 연구소 연구 책임자 겸 구글 리서치 연구원), 잭 헤셀(앨런 인공지능 연구소 연구원), 하미드 팔랑기(마이크로소프트 리서치 수석연구원 겸 워싱턴대 교수), 애나 로르바흐(UC버클리 연구원) 등 이미지 캡셔닝 분야의 세계적인 전문가들이 참여해 최신 연구 동향과 미래 전망 그리고 AI 윤리 등 기술이 사회에 미치는 영향에 관해 심도 있는 논의를 진행했다.

한편, 이번 워크숍에서는 상반기에 진행한 ‘LG 글로벌 AI 챌린지’ 시상식도 열렸다. 자체 개발한 AI 모델의 이미지 이해 능력을 평가하는 대회인 ‘LG 글로벌 AI 챌린지’에는 총 142개 연구팀이 참여했다. 챌린지 1·2위를 차지한 난징과기대, 카이스트(KAIST) 소속 참가자들은 워크숍에서 연구 성과를 발표하기도 했다.

김승환 LG AI연구원 비전랩장은 “이번 워크숍은 첫 번째 상용화 서비스인 ‘캡셔닝 AI’ 발표와 연계돼 있어 더욱 의미가 깊다”며, “이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너들과 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획”이라고 말했다.

LG AI연구원은 오는 22일까지 진행하는 학회 기간 중 LG전자, LG이노텍, LG에너지솔루션, LG유플러스 등 LG의 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나선다. 이를 위해 지난 19일에는 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 ‘LG AI Day’를 진행했으며, 20일부터 3일간 LG 각 계열사의 AI 연구 인력과 채용 담당자들이 LG 통합 부스에서 각 사의 최신 AI 기술 시연과 채용 상담을 진행한다.

LG 통합 부스에서 △LG전자는 비전 검사 기술 기반으로 운전자의 얼굴 및 시선을 인식해 졸음 및 부주의를 감지하는 기술인 운전자 모니터링 시스템, 냉장고 내 식품의 신선도 변화나 조리 과정에 따른 오븐 내 음식의 상태 변화 등을 시각적으로 구현하는 AI 기술 등을 소개한다.

또 △LG이노텍은 실제 제품을 양산하기 전 디지털 공간에서 미리 테스트해 볼 수 있는 디지털 트윈 기술 △LG에너지솔루션은 하루에 수십만개씩 생산되는 배터리 셀의 불량을 잡아내는 비전 기반의 검사 기술인 이상 탐지(Anomaly Detection) △LG유플러스는 고객들이 미디어 콘텐츠에서 원하는 장면을 손쉽게 찾을 수 있도록 영상 장면의 인물·행동·장소·상황·문자 등 각종 정보를 표현하는 메타 데이터를 추출하는 AI 기술을 선보인다.
[박미영 기자(mypark@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

헤드라인 뉴스

TOP 뉴스

이전 스크랩하기


과월호 eBook List 정기구독 신청하기

    • 지인테크

    • 인콘

    • 엔텍디바이스코리아

    • 핀텔

    • KCL

    • 아이디스

    • 씨프로

    • 웹게이트

    • 엔토스정보통신

    • 하이크비전

    • 한화비전

    • ZKTeco

    • 비엔에스테크

    • 지오멕스소프트

    • 원우이엔지

    • HS효성인포메이션시스템

    • TVT코리아

    • 이화트론

    • 다누시스

    • 테크스피어

    • 홍석

    • 슈프리마

    • 인텔리빅스

    • 시큐인포

    • 미래정보기술(주)

    • 유니뷰

    • 비전정보통신

    • 아이원코리아

    • 인터엠

    • 위트콘

    • 성현시스템

    • 한국씨텍

    • 투윈스컴

    • 스피어AX

    • 다후아테크놀로지코리아

    • 한결피아이에프

    • 경인씨엔에스

    • 디비시스

    • 트루엔

    • 세연테크

    • 프로브디지털

    • 동양유니텍

    • 포엠아이텍

    • 넥스트림

    • 핀텔

    • 위즈코리아

    • 삼오씨엔에스

    • 벨로크

    • 피앤피시큐어

    • 신우테크
      팬틸드 / 하우징

    • 에프에스네트워크

    • 네이즈

    • 케이제이테크

    • 셀링스시스템

    • (주)일산정밀

    • 아이엔아이

    • 새눈

    • 미래시그널

    • 인빅

    • 유투에스알

    • 에이티앤넷

    • 케비스전자

    • 한국아이티에스

    • 엣지디엑스

    • 네티마시스템

    • 에이앤티글로벌

    • 이엘피케이뉴

    • 와이즈콘

    • 현대틸스
      팬틸트 / 카메라

    • 제네텍

    • 구네보코리아주식회사

    • 창성에이스산업

    • 에이앤티코리아

    • 지에스티엔지니어링
      게이트 / 스피드게이트

    • 티에스아이솔루션

    • 엔에스티정보통신

    • 엔시드

    • 포커스에이아이

    • 넥스텝

    • 엘림광통신

    • 메트로게이트
      시큐리티 게이트

    • 레이어스

    • 주식회사 에스카

    • 엠스톤

    • 글로넥스

    • 유진시스템코리아

    • 카티스

    • 세환엠에스(주)

Copyright thebn Co., Ltd. All Rights Reserved.

MENU

회원가입

Passwordless 설정

PC버전

닫기