NC AI가 세계 최대 음성·언어 기술 학회인 '인터스피치(INTERSPEECH) 2025'에서 혁신적인 몬스터 사운드 생성·변환 인공지능(AI) 기술을 전 세계에 공개한다.
17일 NC AI에 따르면 인터스피치는 국제 음성커뮤니케이션협회(ISCA)가 주최하는 세계 최대 규모의 음성 및 언어 기술 학회다. 올해는 17일부터 21일까지 네덜란드 로테르담에서 열린다. NC AI는 이번 학회에서 몬스터 사운드에 특화된 고품질 음색 변환 모델의 구조와 학습 기법을 상세히 다룬 논문과 이를 웹 기반 실시간 변환 시스템으로 구현한 데모 구축 사례 논문 등 총 2편을 발표한다. NC AI는 CD 수준(44.1kHz)으로 음성을 분석, 캐릭터 고유의 거친 숨소리나 날카로운 포효까지 놓치지 않고 담아낸 뒤, 원래 음성의 내용은 유지하면서도 원하는 스타일만 정확하게 덧입히는 기술을 선보인다. '무슨 말을 하는지'와 '어떤 느낌으로 말하는지'를 동시에 인식해 대사뿐 아니라 웃음, 포효, 숨소리 같은 비언어적 요소까지 자연스럽게 변환한다. 조남현 NC AI 오디오 AI 팀장은 "앞으로도 AI를 활용해 창작자의 상상력을 현실로 구현하고, 디지털 콘텐츠 산업 전반에 혁신적인 오디오 경험을 제공하는 데 기여할 것"이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >