영상분석(Video Analytics)이란 무엇인가?
시장에서 ‘지능형…’이라 하면서 여러 가지 용어가 사용되고 있다. 그러다 보니 이 분야에 대해 친숙해지기 위해서는 우선 용어의 정의부터 꿰차지 않으면 혼선이 생기기 십상이다. 업계에서는 뭐라고들 정의했는지 아래에서 살펴보자. 마지막 정의가 가장 함축적이다. 직역하자면 ‘형상의 정보화’ 정도가 된다.
다음으로 시장 주체마다 동일한 기술을 약간씩 달리 부르고 있기 때문에 각각을 다 기억해 두어야 이 분야에서 정보를 수집할 때 혼선이 없다. 의미의 차이는 약간씩 있으나 결국은 다 똑같은 뜻이다.
이 중에서 Video Analytics라는 용어가 동조 세력을 가장 크게 넓히고 있고(특히 미주 쪽), 조만간 IP 카메라의 사실상 표준 프로토콜이 될 것으로 예상되는 ONVIF가 이 용어를 쓰기 이 때문에 여기에서는 이를 직역한 ‘영상분석’ 또는 약자로 VA라는 용어를 쓰기로 한다.
한편 영상분석 기술이 적용된 카메라 같은 특정한 제품을 지칭할 때에는 관례상 ‘지능형 …’이라고 하겠다. 예) 지능형 IP 카메라(Intelligent IP camera)
그러면 영상분석이 무엇인지 이해하기 위해 구구절절 설명하는 것보다는 눈으로 보고 바로 이해할 수 있는 예를 들어 보자. 즉, 모든 DVR이 지원하는 동작(움직임) 감지(Video Motion Detection : VMD)와 VA를 비교해 본다.
VMD와 VA의 비교
VMD 화면을 보면 철길을 건너는 사람의 움직임(motion)도 감지하지만, 우상단의 나뭇잎 흔들림이 움직임이 감지되고 있다. 여기에 알람을 연동시킬 경우 사람이 지나가든 말든 나뭇잎이 흔들리는 대로 하루 종일 알람을 울려댈 수밖에 없다. 따라서 이런 영상에서는 VMD가 무용지물이 된다.
반면, 오른쪽의 VA 화면에서는 철길을 건너고 있는 사람, 즉 의미 있는 움직이는 물체(object)만을 정확하게 감지해서 추적하고 있다. 나뭇잎 흔들리는 것 같은 배경적인 요소들은 지능적으로 판단하여 무시해 버린다. 바로 이 ‘배경을 무시하고 의미 있는 물체의 움직임만 감지해 낸다’는 점이 VA가 VMD와 비교할 수 없는 월등한 기술적 우위를 보이는 근본 이유가 되며, 이 핵심 기술은 ‘물체 추적(Object Tracking)’이라고 불린다.
실제로 VA의 가장 초보적이자 가장 효과적인 적용사례가 실외 영상에서의 (의미 있는) 움직임 감지에 의한 알람 및 녹화 연동이다. 하지만 이는 극히 제한적인 사례일 뿐이고 실제로는 다음과 같은 수많은 응용 분야가 존재한다.
영상분석의 응용 분야
인터넷에서 자료를 찾아보려면 원어를 알아야 하기 때문에 굳이 무리하게 번역하지 않았다. 그리고 각각의 기술들은 워낙 방대할 뿐만 아니라 이 글의 주제를 벗어나기 때문에 여기서 논하지는 않겠다. 다만 딱 한 가지 기억할 것은, 이 모든 기술이 단 하나의 기반 기술, 즉 물체 추적(Object Tracking) 기술에서 유도된다는 것이다. 다시 말해서 물체추적 기술의 성능에 따라 이 모든 응용기술들의 성능이 좌지우지된다는 점에 주목한다. 다음으로 이러한 VA가 얼마나 발을 담글 만한 시장인지 그 규모에 대해서 알아보자.
영상분석 세계시장 예측
위의 그래프는 IMS Research 사에서 ‘지능형 영상감시 기기’(카메라, 인코더, DVR, NVR 등 포함, 영상분석 S/W 제외)에 대해 ‘Best & Worst Case’ 시나리오를 예측한 보고서 자료로, VA 시장이 향후 5년간 잘 되면 연평균 46.7%, 못 되도 최소한 24.2%의 성장률(CAGR 기준)은 나타낼 것임을 보여준다.
최악인 24.2%조차 IMS Research 사의 2009년판 ‘The World Market for CCTV and Video Surveillance Equipment’ 보고서에 예측된 네트워크(IP) 영상감시 전체시장의 5년간 성장률 예측치인 CAGR 27.3%에 맞먹는다는 점에 유의하자. 같은 기간 아날로그 카메라는 1.6%, DVR은 6.1%밖에 안 되니 그 성장률의 격차가 실로 위기감을 불러일으킬 정도이다.
참고로 2008년도에 집계된 네트워크 영상감시 전체 시장규모가 15억 9,800만 달러이고, 지능형 영상감시 기기는 1억 1,600만 달러이므로 아직 초창기일 수밖에 없는 2008년 기준으로도 7%는 넘어서고 있다. 쉽게 얘기해서 2008년 전체 IP 제품 매출의 7%는 지능형 제품이었다라고 생각해도 크게 틀리지 않는다.
사실 7%라면 무시할 수도 있는 수치이다. 하지만 채널당 단가 개념으로 보면 절대 무시할 수가 없다. 지능형 기기들의 채널당 판매가(브랜드 제품 기준)가 자그마치 1,000달러에 육박하기 때문이다. DVR 채널당 판매가가 동일 기준으로 대강 100달러 전후라 하므로, 지능형 제품이 10배나 비싼 어이없는 수준의 고가에 팔리고 있다는 얘기다.
결국 중국, 대만 업체에 쫓겨서 수익에 허덕이는 제조사 입장에서는 VA 시장이 더 뜨기 전에 발을 담가야 하는 거 아닌가 하고 심각하게 고민하게 된다. 그렇지만 막상 필자의 회사에서 VA 제품을 그런 DVR 제조사에 제안해 보면, ‘헉~ 1채널이 DVR 한 대 값이네~’라는 얘기가 바로 나오면서 주저한다. 하지만 시장에서 그렇게 팔린다는데 어쩌랴.
왜 영상 분석이 필요한가?
이 화두에 대한 답은 널리 인용되는 여기 이 사진 한 장으로 설명이 끝난다. ‘카메라는 너무 많은데 사람은 모자란다(Too Many Cameras, Not Enough People)’는 것이다.
왜 모자라는지, 이에 대한 유명한 인용구 2가지만 소개하겠다. ‘지능형’ 한다고 하면 필수로 알아야 하는 영업 멘트이니까 수출하는 분들은 원문도 알아 두자. 이 인용구로 수많은 고객사의 의사결정자들이 설득당했다고 하니 ‘아직도’ 지능형을 잘 모르는 고객들에게는 충분히 통한다고 하겠다(단, ‘아직도’에 유의할 것).
그럼 직관적으로 왜 필요한지는 알겠는데, 구체적으로는 어떤 이득이 있을까?
영상분석 기술의 이득
수많은 얘기들이 있은데 그건 인터넷에 널린 각종 자료들을 참고하도록 하고, 실제로 의사 결정자들이 가장 확실히 Ok를 하게 했던 이득은 통계적으로 딱 두 가지였다는 데 주목하자. [IMS Research, IMS VCA Conference 2007 발표내용 참고]
왠지 2% 부족한가? 그렇다면 하나만 더 알아 놓자. VA에 대해 가장 비판적인 인터넷 사이트인데, 거기에서조차 인정한 이득이 있다. [출처 : IP Video Market Info, 2008년 9월 7일자, “Video Analytics Greatest Value - Storage Reduction”] 자, 여기까지는 장밋빛이다. 그러나 빛이 밝을수록 그늘 또한 짙은 법. 영상분석 기술에는 알 만한 사람은 다 아는 치명적인 원죄가 있다. 원죄는 바로 “그거 되냐?”는 것이다.
영상분석, 그거 됩니까?
이는 첨단제품들이 등장한 초창기에 꼭 나타나는 현상이다. 기술은 구현에 급급한데 반해 홍보나 판촉이 너무 앞서가다 보니, 고객들의 기대와 제품의 완성도가 심각하게 불일치되어 생기는 일이다.
그러면 도대체 뭐가 가장 문제인가? 고맙게도 IP Video Market Info라는 한 사이트에서 지난해 8월 중순에 설문조사 결과를 발표했는데, 그 내용이 자못 의미심장하다.
‘그거 되냐’는 설문에 대해 64%가 ‘네’라고 한 것은 보는 시각에 따라 다행이라 생각할 수도 있겠지만, 36%나 되는 사람들이 ‘아니오’라고 했다는 것은 여전히 심각함을 뜻한다.
그래서 해당 사이트에서 설문을 하나 더 했는데, 그 결과가 VA를 업으로 삼는 사람들에게 빛이 되는 결과를 내주었다.
우선 3위를 보자. 아주 당연한 결과다. DVR 대비 채널당 10배나 비싸서는 주류 시장으로 가기에 요원하다. 2위인 26%는 ‘더 쉬운 설정’을 요구했다. 사긴 했는데 쓰기가 너무 어렵다는 것이다. 경비원 숫자를 줄이려다 더 값비싼 컨설턴트를 고용하는 우를 범하는 일이 많다. 실제로도 지능형 제품들의 설정에는 최종 고객들이 손도 대지 않는 게 현실이다. 누군가 나와서 최적화를 해 줄 수밖에 없고 고객들은 거기에 돈을 써야 한다. 그래도 1위보다는 낫다. 대개는 설치 후 어느 정도까지만 돈을 쓰면 되니까.
1위인 55%는 점잖은 말로 ‘더 나은 성능’을 원했다. 사서 설치까지 했는데 정작 써 보니 도저히 쓸 수가 없다는 것이다. 이는 전적으로 짜증나는 ‘오경보(false alarm)’ 때문이다. 오경보라는 것은 별일 없는데 알람이 울리는 것을 말한다. 사실 오경보는 지능형 제품의 아킬레스건이라 할 수 있다. 이것 때문에 시장 자체가 죽어버린다는 사람도 있을 정도이다.
실제로도 VA 시장이 과거에 잠깐 떴다가 확 죽은 후에 지금은 막 되살아나고 있는 시점에 있다는 것이 시장조사 통계에서 밝혀졌다. 떴다가 죽을 때 가장 크게 기여한 게 오경보라고 봐도 무리가 없다.
그러면 이대로 VA 기술을 외면해도 되는 것인가? 그건 아닌 게 분명하다. 앞서 말한 대로 VA 시장이 잘 되면 연평균 46.7%, 못 되도 최소한 24.2%는 성장한다니 말이다.
그렇다면 결론은 확실하다. VA 기술을 개발하든 도입하든 하여 차세대를 준비하되, 분명한 기준에 따라 기술을 선택해야 한다는 것이다. 쉽게 말해서 앞서 언급한 1위, 2위, 3위의 핵심 문제점을 어떻게 해결하였나에 대해 설문의 % 수치만큼의 가중치를 부여하여 점수를 매겨서 선정하면 되는 것이다. 굳이 정리를 하자면 이렇다.
결언
영상분석 기술은 다음과 같은 기준에 의하여 평가하여 개발하거나 도입해야 한다.
다만 위의 가중치는 최종고객의 입장에서 본 것이기 때문에 특히 외부에서 기술을 도입할 경우에는 기술적인 통합의 난이도에 대해서 별도로 판단해야 할 것이다. 지면이 모자라서 여기서 이만 줄이고자 한다. 후반부인 ‘어떻게?’에 대해서는 설명을 하지 못했는데, 독자들의 요청이 있다면 따로 기회가 주어지지 않을까 기대한다.
<글 : 임 인 건 | ㈜유디피 연구소장(iklim@udptechnology.com)>