구글이 제미니와 베오 3 비디오 생성기 등 자사의 인공지능(AI) 모델을 훈련하기 위해 유튜브의 방대한 비디오 라이브러리를 사용하고 있는 것으로 밝혀졌다. 그러나 대부분의 업로더들이 이같은 사실을 알지 못하던 만큼 향후 창작자와 미디어 회사에 지적재산권(IP) 리스크가 발생할 수 있다는 우려가 나온다.
19일(현지 시간) CNBC는 구글이 200억 개의 유튜브 동영상을 활용해 이같은 차세대 AI도구를 훈련시키고 있다고 보도했다.
유튜브는 "자사의 유튜브 동영상 저장소를 활용해 AI모델을 훈련시키고 있는 것은 사실이나, 동영상의 일부만 사용하며 창작자 및 미디어 기업과 계약을 준수한다"고 입장을 밝혔다. 그러나 전문가들은 구글이 AI 모델을 훈련시키기 위해 유튜브 콘텐츠를 사용하는 사실을 창작자와 미디어 기관들이 충분히 인식하지 못하고 있으며 이를 거부할 방법이 없다고 지적했다. 유튜브는 현재 아마존, 애플, 엔비디아와 같은 외부 AI기업에게만 '학습 거부권' 옵션을 한정적으로 제공 중이다.
CNBC에 따르면 유튜브는 이제까지 업로드된 동영상 가운데 어느 정도의 규모가 AI 학습에 사용되는지 밝히지 않았다. 그러나 플랫폼 규모를 고려할 때 전체 동영상의 1%만 학습하더라도 23억 분 분량의 콘텐츠가 사용된다. 전문가들은 이에 대해 "경쟁 AI 모델이 사용하는 학습 데이터의 40배가 넘는 규모"라고 설명했다.
유튜브 창작자들은 자신들이 만든 콘텐츠가 AI 훈련을 위한 데이터로 사용되면서 결국 경쟁 시스템이 될 수 있다는 점에서 우려를 표명하고 있다. 창의적인 아이디어를 담아 콘텐츠를 만들었는데 베오3 등 AI 생성 도구가 이를 학습해 비슷한 영상물을 만들어낼 수 있다는 얘기다. 온라인 창작물 라이선스를 제공하는 버밀리오의 최고경영자(CEO) 댄 닐리는 "자신의 가짜 이미지가 다른 플랫폼에 유포되는 것을 발견하는 크리에이터들이 늘고 있다"며 "베오3 등 새로운 도구는 이같은 추세를 가속화할 것"이라고 지적했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >