사회·정리: 고광본 선임기자(부국장)
‘서산 너머 노을이 지는 가운데, 74세 할머니가 지적장애 딸과 함께 밭일을 마치고 지친 발걸음으로 제방을 지나 집으로 향하고 있다. (두 눈을 클로즈업하며) 도중에 회한에 찬 모습으로 서산에 지는 태양을 바라본다.’ 이처럼 한 두 문장으로 원하는 장면과 모습을 문자 기반 동영상 생성 인공지능(AI) 모델인 ‘소라(Sora)’에 입력하면 수초만에 최대 1분 길이 동영상을 얻을 수 있다. 챗GPT 개발사인 오픈AI가 지난달 선보인 새 기술이다.
생성형 AI를 활용하면 광고 영상이나 3D 애니메이션 영화, 교육 영상 등을 손쉽게 만들 수 있다. 이제는 생성형 AI를 기반으로 각종 앱이 우후죽순처럼 등장하는 추세다. 2022년 말 챗GPT가 첫 출시된 이후 마이크로소프트(MS)는 물론 구글·메타 등 다른 빅테크 기업도 생성형 AI 개발에 드라이브를 걸고 있다. 생성형 AI의 퀀텀점프에 맞춰 인간 지능에 가깝거나 능가하는 범용 인공지능(AGI) 구현도 앞당겨질 것으로 보인다.
생성형 AI가 학습한 빅데이터와 산출물(그림·음악·시·소설·영화 시나리오·동영상·논문 등)에 관한 저작권을 놓고 세계적으로 논쟁이 뜨거워지는 이유가 여기에 있다.
서울경제신문은 8일 한국프레스센터에서 한국인공지능윤리학회·국제인공지능윤리협회와 함께 ‘생성형 AI와 우리의 미래’를 주제로 ‘지속가능한 AI 포럼’을 공동 주최했다. 이 자리에서 리 히킨 MS 아시아 AI 기술&정책 리더는 “저작권법에서는 저작권 보호 작품에서도 지식 개발 기술을 사용하는 것은 허용한다”며 “무엇보다 AI 사용자는 저작권을 존중하고 AI 도구는 사회에 이익을 줘야 한다는 원칙을 지켜야 한다”고 강조했다. AI와 AI 앱을 개발할 때 저작자와 창작자의 권리를 준수하되 저작권 보호 작품을 활용해 AI와 기술을 개발할 권리도 동시에 보장하는 게 바람직하다는 것이다.
뉴욕타임스는 작년 말 오픈AI와 그 최대주주인 MS를 상대로 자사 콘텐츠를 챗GPT 학습에 무단 사용했다며 소송을 걸었다. 히킨 리더는 “창작자는 새 작품을 만들 때 AI의 도움을 받을 수 있어야 한다”며 “AI 기술로 창작할 경우 다른 창작자와 마찬가지로 저작권에 참여할 수 있도록 해야 한다”고 강조했다. 그는 이어 MS와 오픈AI와의 관계에 대해 작년 말 샘 울트먼 오픈AI 최고경영자(CEO)의 해고·재등판 해프닝을 거론하면서 “분명한 사실은 두 회사가 서로 경쟁도 하는 사이라는 것”이라고 했다.
유럽의 경우 EU집행위·이사회·의회가 올 초 TDM(빅데이터에서 일정한 패턴을 찾거나 정보를 추출·분석) 과정에서 AI 학습에 사용된 정보를 요약해 제공하되 투자와 혁신도 동시에 촉진하는 내용의 EU 인공지능법(AI Act)에 합의했다. 안전한 AI 개발 시스템과 저작권 사이 균형을 맞추려는 것이다. 미국에서는 조 바이든 행정부가 지난해 행정명령을 통해 AI 생성 콘텐츠 식별을 위한 워터마크(문서·사진 등에 흐릿하게 삽입한 이미지) 지침을 만들되 공공 데이터 공개 확대와 민간 데이터 거래 유도에 적극 나서고 있다. 국내에서는 문화체육관광부와 한국저작권위원회가 인간의 창작 행위가 관여됐을 때 저작물성을 인정하는 방향으로 정책을 마련하고 있다.
100여명의 청중이 참석한 이날 포럼에서는 기사 등 언론사 콘텐츠에 관한 저작권 보호와 공정이용 주장이 대립했다. 블로그·게시판 등에 올라오는 글을 AI 학습에 사용할 수 있느냐도 쟁점이 됐다.
국내 대표적인 생성형 AI 개발사인 네이버의 이광용 정책전략리더는 “지난해부터 언론사가 동의하지 않으면 뉴스 데이터를 AI 학습에 사용하지 않고 있다”며 “학습에 활용할 경우 언론사와 협의해 동의 절차를 거칠 것이다. 해외 논의 동향을 참조할 필요가 있다”고 했다. 현재 네이버는 개인정보 데이터에 대한 AI 학습은 비식별화 조치를 거치고 있는데 학습 품질을 높이기 위해 개인정보 규제의 완화를 원하고 있다. 과학기술정보통신부도 올 초 AI 기업이 개인정보를 활용한 서비스 모델을 내놓을 때 일부 규제 샌드박스를 적용받도록 했다. 이렇게 되면 자율주행 배달로봇의 AI 학습 과정에서 영상정보를 비식별조치 없이 활용할 수 있어 보행자와 로봇의 충돌 방지 효과를 꾀할 수 있다는 것이다. 이 리더는 “AI 저작권이 불분명해 개발의 불확실성이 초래된다”며 “만약 침해되는 개인정보가 없고 AI 학습 품질이 높아지는 분야가 있다면 개인정보 비식별조치 완화도 필요하다”고 주장했다.
생성형 AI 스타트업인 포티투마루(42Maru)의 김한수 최고기술책임자(CTO)는 “저작권 보호와 AI 기술 발전을 모두 고려해 학습 데이터와 AI 산출물에 대한 권리와 저작권 이슈를 여러 각도에서 조명해야 한다”며 “합리적인 저작권 보상 체계를 마련하되 글로벌 시장에서 경쟁하는 AI 기업의 학습권 보장도 결코 간과해서는 안된다”고 강조했다.
이에 대해 여도관 한국방송협회 기획심의부장은 “AI 학습에 방송콘텐츠를 사용한다면 사전 협의와 적절하고 합리적인 보상이 필요하다”며 “우선 AI학습에 쓰인 데이터가 투명하게 공개돼야 한다”고 지적했다. 여 부장은 이어 “사용자도 양질의 정확한 데이터로 학습한 생성형 AI 서비스를 선택하게 돼 있어 학습 데이터 공개는 빅테크에게도 이익”이라고 했다. 신한수 서울경제신문 전략기획실 부국장은 “세계신문협회·한국신문협회·한국온라인신문협회도 지속가능한 AI 개발을 위해 고품질 데이터 제공처에 대한 지원과 인센티브 제공이 이뤄져야 한다고 밝히고 있다”며 “뉴스를 AI 학습 데이터로 활용하려면 정당한 대가 산정이 이뤄져야 한다”고 힘줘 말했다. 학습 데이터의 투명성을 높여야 건강한 AI 생태계를 구축할 수 있다는 것이다.
박정훈 한국저작권위원회 선임연구원은 “각 국가의 AI 기술 수준과 저작물 시장의 구조, 이해관계자의 이익 등 변수가 복잡하다”며 “그만큼 AI와 저작권의 관계는 복잡한 이슈라 앞으로 국제 동향을 주시하며 국내에 맞는 균형있는 법·제도를 마련해야 한다”고 제안했다. 김명주 국제인공지능윤리협회장(서울여대 정보보호학과 교수)은 “딥러닝 기반의 AI 개발이 챗GTP 등 생성형 인공지능의 출현으로 저작권 침해 논쟁으로 비화했다”며 “AI 개발과 저작권 보호의 균형점을 찾는 게 중요하다”고 조언했다.
손동영 서울경제신문 대표이사 사장은 “AI 개발을 촉진하되 인간의 창작성이 들어간 정도에 따라 저작권을 차등화하는 노력이 필요하다”며 “AI가 오염된 데이터를 학습해 반사회적인 행동을 하지 않도록 하는 것도 중요하다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >