네이버클라우드는 ‘클로바 스피치(CLOVA Speech)’에 실시간으로 생방송 자막을 제공하는 ‘실시간 스트리밍’ 기능을 출시했다고 2일 밝혔다.
클로바 스피치는 인공지능(AI) 기반으로 음성을 텍스트로 변환하는 기업용 서비스다.
실시간 스트리밍 기능은 라이브 방송 등 실시간 스트리밍 영상에서 화자가 말하는 내용을 즉시 텍스트로 추출해주는 기술이다. 한국어, 영어, 일본어 3개 국어를 지원하며 음성 어절 단위로 텍스트가 형성된다.
현재 생방송 실시간 자막 서비스는 속기사가 일일이 작성했다. 실시간 스트리밍 기술을 활용하면 별도 타이핑 작업 없이 실시간으로 자막 송출이 가능하다. 고객센터도 통화 내용을 즉각 텍스트화해 모니터링 할 수 있어 보다 빠른 고객 대응이 가능해진다.
네이버클라우드는 이번 신규 서비스 출시에 맞춰 다양한 옵션을 제공하고, 서비스 요금을 인하했다.
음성인식과 화자인식 비용의 경우 기존 보다 40% 낮췄다, 단일 요금제가 아닌 음성인식, 화자인식, 이벤트탐지(박수, 음악, 함성 등 인지)로 기능을 나눠 각 기능별로 요금을 세분화했다. 영어 발음의 정확도를 판단해주는 기능도 선택 옵션으로 추가됐다.
네이버클라우드 관계자는 “'실시간 스트리밍’ 기능은 방송사, 라이브커머스 기업, 유튜버 등 실시간 방송을 필요로 하는 산업군에서의 활용도가 높을 것으로 예상된다”면서 “서비스를 고도화할 것”이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >