전체메뉴

검색
팝업창 닫기
이메일보내기

'발레하는 사람' 문장 입력하면…가상인간이 그대로 구현

카카오브레인 AI '플레임' 공개

복잡한 텍스트도 동영상으로 바꿔

세계 상용안돼 시장 선점 기대감

카카오브레인과 고려대 연구팀이 공동 개발한 동영상 생성 인공지능 '플레임'에 명령어를 입력해 구현한 동작. 비슷한 명령어들 간 차이를 구분해 서로 다른 동작을 구현한다. 왼쪽부터 '발레댄스를 추는 사람' '발레리나처럼 춤추는 사람' '발레 연습을 하며 회전하는 사람'을 명령어로 입력한 결과. 사진 제공=카카오브레인




카카오가 텍스트를 동영상으로 만들어주는 새로운 인공지능(AI) 기술을 공개했다. 챗GPT를 둘러싸고 빅테크 간 AI 경쟁이 격화하고 있는 가운데 국내 테크기업들도 경쟁력을 키우기 위해 고난도 신기술 확보에 적극적으로 나서는 모습이다.

14일 정보기술 업계에 따르면 카카오의 AI 전문 자회사 카카오브레인은 이달 9일(현지시간) 세계 최고 권위의 AI학회인 ‘전미인공지능학회(AAAI)’에서 최성준 고려대 인공지능학과 교수 연구팀과 공동 개발한 텍스트 투 모션(text to motion·텍스트를 동작으로 바꿔주는) AI ‘플레임(FLAME)’에 관한 논문을 구두 발표했다. 구두 발표는 AAAI가 높은 평가를 내린 논문을 선정해 이뤄진다.

플레임은 초거대 AI를 활용해 이용자가 명령어를 입력하면 그에 맞는 동작을 가상인간을 통해 구현해준다. 가령 ‘오른발로 발차기하는 사람’을 입력하면 화면 속 가상인간이 실제로 오른발을 들어 발차기를 한다. 복잡한 문장을 입력해도 완성도 높은 동작을 만들어낸다고 회사는 설명했다. 김일두 카카오브레인 대표는 “플레임은 게임, 애니메이션, 영화 등 모션 그래픽 제작이 필요한 영역에서 작업 자동화와 업무 효율성 증진에 큰 기여를 할 것”이라고 말했다.

구글의 동영상 생성 AI '이매진 비디오'가 만든 동영상들. 구글 웹사이트 캡처




플레임을 포함하는 텍스트를 동영상으로 바꿔주는 ‘텍스트 투 비디오’ AI는 세계적으로도 아직 상용화되지 못한 기술인 만큼 카카오브레인도 시장 선점을 노려볼 수 있다. 지난해 하반기 메타가 ‘메이크 어 비디오’, 구글이 ‘이매진 비디오’라는 자체 AI를 공개한 바 있다. 플레임을 공동 개발한 최 교수는 “여러 기업들이 텍스트 기반의 비디오 생성에 집중하고 있다”며 “차별화된 연구 결과를 만들겠다”고 말했다.

카카오브레인은 한국어 모델 ‘코(Ko)GPT’, 텍스트-이미지 멀티모델 ‘칼로(Karlo)’에 이어 플레임 개발을 통해 초거대 AI 경쟁력을 한층 더 키울 전망이다. 특히 오픈AI의 챗GPT와 네비어의 하이퍼클로바 등에 크게 밀리는 언어 모델보다는 이미지·동영상 같은 멀티미디어 영역에서 승부를 펼치려는 모습이다. 칼로를 활용한 이미지 생성 애플리케이션 ‘비 디스커버’는 지난해 10월 상용화된 데 이어 올해 1·4분기 전문가용 유료 버전 출시를 앞두고 있다. 카카오톡 프로필과 배경화면 제작에도 칼로가 도입된다. 코GPT는 AI 비서와 마케팅 도구 같은 버티컬 서비스로 연내 상용화된다.

카카오브레인의 AI모델 ‘칼로’가 그린 ‘포춘코리아’ 2월호의 표지 그림. 사진 제공=카카오브레인
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서울경제 1q60