“책 한 권 AI 학습을 시키려는데 출판사에서 100만 원을 불러서 포기했습니다.” 대규모언어모델(LLM)을 개발하는 국내 한 인공지능(AI) 스타트업 대표의 하소연이다. 해당 대표는 올해 초 과학 서적을 LLM 개발을 위한 학습 데이터로 활용하려 했으나 계획을 접었다. 정가 2만~3만 원 대의 도서를 학습하는 데 요구되는 저작권 사용료가 터무니 없이 비싸다고 느꼈기 때문이다. 프로젝트 담당자는 “책은 AI 학습에 가장 적합한 고품질 자료지만 저작권법의 제약 때문에 중소기업은 사실상 활용할 수 없다”며 “결국 무료 공공데이터에 의존하지만 실제 쓸 만한 데이터는 많지 않다”고 말했다.
중소기업 10곳 중 1.6곳만 데이터 도입…"비싸서 애시당초 포기"
최근 이처럼 데이터 규제로 인해 AI 신사업을 포기하는 중소기업이 늘고 있다. 대기업이나 자본력이 있는 일부 기업은 고가의 데이터를 구매해 모델을 고도화하지만, 다수의 중소·중견기업은 법적 불확실성 때문에 데이터 확보부터 좌절한다. 한국데이터산업진흥원 조사에서도 매출 1000억 원 이상 기업의 데이터 도입률이 40%를 넘는 반면, 중소기업은 16%대에 불과했다.
가장 큰 장벽은 저작권법이다. 한국에는 유럽연합(EU)이나 일본처럼 텍스트·데이터마이닝(TDM)을 명시적으로 허용하는 예외 조항이 없다. AI가 책·논문·뉴스를 학습하는 과정은 ‘복제’로 간주될 수 있어 사전 허락 없이는 불가능하다. 기업들은 결과물이 아닌 학습 자체까지 규제하는 것은 과잉 규제라 주장한다. 하지만 정부가 내년 시행을 예고한 ‘AI 기본법’에도 저작권 문제는 포함되지 않았다. 공공데이터도 대안이 되기 어렵다. 정부가 제공하는 공공누리 데이터 중 상당수는 ‘상업적 활용 금지’ 조건이 붙어 있어 실제 AI 학습에 쓰기 힘들다. 지도, 교과서 삽화, 정부 보고서 등 많은 자료가 법적으로 제약을 받는다.
TDM 면책 도입하는 해외…한국은 이제서야 법안 발의
반면 해외는 규제가 빠르게 정비되고 있다. 미국 법원은 올해 앤스로픽이 뉴스 데이터를 학습한 것을 두고 “학습 과정 자체를 불법으로 볼 수 없다”며 손을 들어줬다. 유럽연합은 2019년 지침 개정으로 TDM 예외를 명문화해 연구기관은 물론 기업도 저작물을 합법적으로 학습할 수 있도록 했다. 일본은 아예 2018년부터 목적을 불문하고 저작물 분석을 허용했다. 이에 따라 글로벌 기업들은 폭넓은 데이터 접근을 기반으로 AI 경쟁력을 강화하는 중이다.
국내에서도 2021년 국회가 TDM 예외 조항을 포함한 저작권법 개정안을 발의했지만, 권리자 단체 반발로 무산됐다. 창작물 가치 훼손, 보상 구조 미비 등이 쟁점이었다. 이후 정부와 학계는 단계적 허용이나 옵트아웃 제도 등 절충안을 논의했지만 합의에 이르지 못한 상황이다. 최근 정부가 관련 규제 정비를 마련하고 있지만 서둘러야 한다는 의견도 나온다. 업계에 따르면 중소벤처기업부는 ‘중소기업 AI 활용 및 확산법(가칭)’을 마련해 이달 중 발의할 계획이다. 법안에는 업계가 꾸준히 요구해온 텍스트·데이터마이닝(TDM) 면책 조항이 포함될 것으로 알려졌다. 이는 기업들이 법적 규제를 준수하면서도 필요한 데이터를 보다 안정적으로 확보할 수 있도록 지원하기 위한 조치다.
국가 AI 위원회 컨트롤타워 역할 시급…통합 거버넌스도 필요
업계에서는 정부가 서둘러 통합 거버넌스를 마련해야 한다는 목소리도 높아지고 있다. 한국인공지능·소프트웨어산업협회(KOSA)는 2일 ‘AI 산업전환을 위한 데이터 전략 보고서’를 발간하고, 산업별 맞춤형 가이드라인 개발, 통합 거버넌스 구축 등을 제안했다. 보고서는 우선 국내 기업들이 데이터 활용 과정에서 직면한 구조적 부담을 해결하기 위해 산업별 맞춤형 가이드라인 개발이 필요하다고 강조했다. 나아가 현재 개인정보보호위원회·보건복지부·금융위원회 등 여러 부처가 각각 별도의 지침을 내놓으면서 규제가 중복되거나 상충하는 사례가 발생하는 만큼 분산된 지침을 통합할 거버넌스 체계를 구축해야 한다고 제언했다. 또한 표준화된 데이터 거래 플랫폼을 구축해 데이터 제공자가 정해진 기준에 따라 사전에 전처리한 자료를 플랫폼에 올리고 이를 수요자에게 제공하는 데이터 전처리 효율화 방안도 언급했다.
아울러 KOSA는 국가 AI 위원회의 컨트롤타워 역할 강화도 제안했다. 과학기술정보통신부는 이날 AI 정책을 총괄할 ‘국가 AI 전략 위원회’의 설치 및 운영에 관한 규정(대통령령)이 국무회의에서 의결됐다고 밝혔다. 보고서는 “대통령이 국가AI 위원회에 더 많은 관심과 지원을 보내며 범부처 차원의 AI 및 데이터 관련 주요 안건이 이 위원회를 통해 논의되고 의결될 수 있는 체계를 구축해야 한다”며 “이를 통해 국가 차원의 통합적이고 일관된 데이터 정책을 추진할 수 있을 것”이라고 설명했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >