각종 산업과 신기술, 플랫폼의 발달로 인해 시장에 끊임없이 새로운 인공지능 모델이 등장하면서 양질의 데이터를 얼마나 많이 확보하고 잘 분석하여 정확한 정보와 서비스를 제공할 수 있는지 여부가 비즈니스의 핵심 경쟁력으로 자리잡고 있다.
인공지능 챗봇 및 빅데이터SW 전문기업 와이즈넛(대표 강용성)은 지난해 4월 선정된 과학기술정보통신부 주관 SW컴퓨팅산업원천기술개발 사업 중 ‘이종 정보 활용 및 데이터 융합을 통한 데이터 증식 기술 개발’ 과제의 주관기관으로서 2차년도 개발을 완료했다고 밝혔다.
오는 2022년까지 진행되는 본 과제는 확보된 원시 데이터를 분류하여 형상(이미지, 텍스트, 오디오, 비디오 등)이 다른 메타 데이터를 추출하고 외부에 오픈된 데이터 포털을 통해 필요한 데이터를 추가 확보하여, 메타 정보 기반의 상호연관성이 높은 다른 데이터를 증식하거나 데이터 간 융합을 통해 양질의 데이터를 확보하는 기술 개발 및 상용화를 목표로 한다.
예를 들어, 비디오 데이터를 확보하면 그 안에서 음향, 음성, 이미지, 텍스트 등을 각각 추출하여 외부에 오픈된 데이터 포털(AI Hub, Kaggle, CoCo, 공공데이터 포털 등)을 통해 얻는 데이터 메타정보와의 관계 기반 탐색 시스템을 통해 연관 데이터를 증식시키는 방식이다.
이를 통해 각 비즈니스 분석 목적에 맞는 양질의 AI 학습용 데이터를 손쉽게 확보할 수 있어 데이터 확보를 위해 발생하는 사회적 비용 절감 효과가 기대된다. 또한 인공지능 데이터 확보 과정에서 다양한 포맷에 기반한 데이터 증식으로 데이터 편향 문제를 해결할 수 있을 것으로 기대되고 있다.
특히 와이즈넛의 이번 데이터 증식 기술은 기존에 이미 확보한 데이터에서 파생하여 동일 종류 데이터간 단편적인 증식만 가능했던 방식과 대조적이다. 또한 인공지능(AI)을 활용하는 모빌리티, 헬스케어, 생활 및 안전분야 등 다방면에서 데이터 증식 기술이 활용될 수 있다는 장점이 있다.
강용성 와이즈넛 대표는 “이번 데이터 증식 기술이 결국 양질의 학습데이터를 추가 확보하여 인공지능 기술의 분석 정확도와 데이터 신뢰성을 대폭 향상시키는 결과로 이어질 것이라 기대된다”며, “앞으로도 와이즈넛은 지속적으로 의미있는 데이터를 확보하고 재생산하는 등 국내 데이터 기술력 강화 및 혁신을 주도해 나갈 것”이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >