서울대 데이터과학과지식창출연구센터, 교육용 통계 패키지 무상 보급
[보안뉴스 김태형] 제타바이트 수준 빅데이터 시대에 우리나라가 주도권을 잃지 않기 위해 준비해야 할 것은 무엇일까? 폭발적으로 증가하는 방대한 양의 데이터를 분석하여 미래예측이나 의사결정을 위한 새로운 가치를 창출하는 빅데이터 중심으로 IT 패러다임이 변화되는 가운데, 국내 연구진이 빅데이터 분석이 가능한 통계 패키지(가제:SRC-STAT)를 개발했다.
1제타바이트(Zettabyte)는 데이터 정보량을 나타내는 단위로, 10의 21제곱 바이트(byte), 즉 10억T(테라)바이트, 1조G(기가)바이트의 양이다.
이번 성과는 서울대 데이터과학과지식창출연구센터(센터장 이영조 교수http://srcdsc.snu.ac.kr/srcstat/)에서 미래창조과학부와 한국연구재단이 추진하는 선도연구센터지원사업의 지원 및 에스이(랩)과 서울대학교 빅데이터센터 등의 후원으로 수행되었으며, 센터에서는 개발한 통계 패키지를 국내 교육기관에서 사용할 수 있도록 무상으로 보급하고 있다.
현재 서울대학교 통계학과는 물론 서울대 의과대학 및 의료정보센터에서 시범적으로 활용하고 있으며, 전남대학교·부경대학교·대구한의대학교 등에서 통계학 교과과정에 활용하고 있다.
최근, 글로벌 IT기업인 IBM이 대형 통계소프트웨어사 SPSS를 인수하는 등 세계적으로 빅데이터 분석용 통계 소프트웨어 개발ㆍ활용에 대한 관심이 높아지고 있으나, 현재 국내 대학, 연구소, 기업 등에서 주로 사용하는 통계 프로그램은 대부분 외국제품으로, 매년 저작권료를 지불해야 하기 때문에 국산 프로그램 개발에 대한 요구가 많았다.
이번 개발된 통계패키지는 평균, 분산 등 기초통계부터 의학분야에서 사용되는 생존자료, 사회과학 분야에서 활용되는 다변량 자료 및 다수준 모형뿐만 아니라, 금융분야에서 활용되는 시계열자료 등 다양한 자료를 분석할 수 있는 범용 프로그램이다.
실제 센터는 동 패키지를 활용하여 서울의대 핵의학과와 공동으로 대용량 고차원 뇌영상 기술을 개발하였으며, 신경과와 함께 급성허혈증 뇌졸중 응급환자 200,000건의 혈압 데이터 분석에 적용해 뇌졸중 내원 후 증상이 악화되는 경우를 예측하는데 활용한 바 있다.
특히, 센터가 보유한 다양한 다단계일반화모형 등에 기반한 독창적인 통계기법과 계산 알고리즘을 구현하고, 데이터 분석결과에서 직관적으로 데이터의 의미를 알 수 있도록 일목요연하게 시각화하는 등 기존 기술과 차별화했다고 연구진은 밝혔다.
센터의 국산 통계패키지 개발은 외국산 기존 통계 프로그램들에 대한 도전의 시작이며, 빅데이터 시대 핵심인 국내 소프트웨어 산업의 촉매제 역할을 할 것으로 기대된다. 센터는 앞으로도 다양한 분야에서 활용할 수 있도록 지속적으로 통계패키지의 기능을 개선해 나갈 예정이다.
이영조 센터장은 “빅데이터 가운데 의미 있는 지식을 발견할 수 있는 분석도구인 통계 소프트웨어가 없다면 지식가뭄 현상을 마주할 것”이라며, “SRC-STAT으로 빅데이터 분석이 가능할 것이며, 이번 성과는 국내 통계SW 산업 발전의 계기”라고 밝혔다.
[김태형 기자(boan@boannews.com)]
<저작권자: 보안뉴스(http://www.boannews.com/) 무단전재-재배포금지>