전체메뉴

검색
팝업창 닫기
이메일보내기

"책 한권 학습하는데 100만원" 양질의 공공데이터 확대 절실…조주현 “시장 다변화 등 정책 지원으로 중기 혁신 도울 것” [AI 프리즘*스타트업 창업자 뉴스]

AI 학습 위한 구매한 데이터 가격 점점 올라…쓸 만한 데이터 시장에서 ‘희소’

조주현 중소벤처기업연구원 원장, 중기 혁신 지원할 것…내년도 예산 올해보다 10.5% 증가

정부, 웨이퍼 원가 낮춘다…국내 반도체에 대한 美의 고율 관세에 경쟁력 높이기 위함







▲ AI 프리즘* 맞춤형 경제 브리핑

* 편집자 주: AI PRISM(Personalized Report & Insight Summarizing Media)은 한국언론진흥재단의 지원을 받아 개발한 인공지능(AI) 기반 맞춤형 뉴스 추천 및 요약 서비스입니다. 독자 유형별 맞춤 뉴스 6개를 선별해 제공합니다.


AI 데이터 한 권당 100만원, 중소기업 포기하는 이유 [AI PRISM x D•LOG]


[주요 이슈 브리핑]

■ AI 학습 데이터의 막대한 저작권 비용: 국내 AI 스타트업들이 책 한 권을 학습 데이터로 활용하려면 100만 원에 달하는 저작권 사용료를 지불해야 하는 상황이 벌어졌다. 이에 따라 중소기업들은 고품질 데이터 접근이 사실상 불가능해지면서 대기업과의 AI 모델 성능 격차가 급속히 벌어지고 투자 유치에도 심각한 걸림돌로 작용하고 있는 상황이다.

■ 개인정보 보호 규제가 AI 사업 확장 막아: CCTV 영상 분석 같은 유망한 AI 비즈니스 모델들이 모호한 재식별 처벌 위험 때문에 중소기업 도입 단계에서 무산되는 사례가 급증하고 있다. 특히 2023년 개인정보보호법 개정으로 유출 신고 기준이 강화되면서 기업들의 AI 도입 부담이 2배 이상 늘어난 모습이다.

■ 정부의 AI 전환 의지: 기재부가 직원 대상 AI 실습 교육을 선도하고 반도체 웨이퍼 소재 관세를 0%로 낮추는 등 적극적인 지원에 나서고 있다. 한편 근본적인 데이터 접근성과 법적 불확실성 문제가 해결되지 않고 있다.

[스타트업 창업자 관심 뉴스]

1. 책 한권 학습하는데 100만원…양질의 공공데이터 확대 절실

- 핵심 요약: 국내에서 스타트업들이 AI 학습을 위해 구매하는 데이터의 가격이 점점 비싸지고 있음이 확인됐다. 데이터 가격 인상의 이유로는 쓸 만한 ‘고품질 데이터’ 자체가 시장에서 희소성을 띄게 됐기 때문이다. 기업들이 언급하는 고품질 데이터의 대표적인 사례는 ‘책’이다. 실제 국내 대규모언어모델(LLM)을 자체 개발 중인 한 인공지능(AI) 스타트업은 올해 초 과학 서적을 학습 데이터로 활용하려다 출판사에서 책 한 권 당 100만 원에 달하는 사용료 요구로 계획을 접었다. AI 모델이 책·논문·뉴스 등 저작물을 분석하고 학습하는 과정은 원칙적으로 ‘복제’에 해당할 수 있어 저작권자의 사전 허락 없이는 사용이 제한된다. 이에 AI 기업은 학습용으로 콘텐츠를 활용할 경우 모든 저작물에 대해 별도 라이선드를 취득해야하는 상황이다.

2. 조주현 “시장 다변화 등 정책 지원…중기 혁신 도울 것”

- 핵심 요약: 조주현 중소벤처기업연구원 원장이 “정부가 중소기업의 수출 시장 다변화와 해외 전략 투자를 도울 수 있도록 정책적인 면에서 지원할 것”이라고 말했다. 조 원장은 2일 서울 영등포구 CCMM빌딩에서 취임 1주년 기념 기자간담회를 열고 중소벤처기업 전담 정책연구기관인 중기연의 연구·경영 성과를 발표했다. 그는 보호무역주의와 통상 마찰, 디지털 전환의 고착화로 기업 환경이 크게 변화하고 있는 현실을 언급하며 이같이 말했다. 중기부는 내년도 예산안을 올해보다 10.5% 늘어난 16조 8449억 원으로 편성했다. 이에 조원장은 중소·벤처스타트업과 소상공인 대상 예산이 대폭 확대됐다며 “연구개발(R&D)·AI 분야 투자를 통해 우리 경제의 혁신과 중소벤처기업의 체질 개선을 유도하는 마중물 역할을 제대로 하려는 뜻이 담겼다”고 강조했다.

3. ‘반도체 핵심’ 웨이퍼 원가 낮춰준다

- 핵심 요약: 정부가 반도체 웨이퍼를 생산할 때 쓰이는 주요 수입 소재들의 관세를 내년에 0%로 낮추는 방안을 추진중이다. 2일 관계부처에 따르면 산업통상자원부는 도가니, 탄소복합재(CCM), 그라인딩휠 등 총 8종의 반도체 웨이퍼 제조 장비용 소재에 대해 할당관세를 적용하는 방안을 과세 당국인 기획재정부와 협의할 예정이다. 기존 할당관세를 적용하고 있던 석영유리기판 등에 더해 반도체 웨이퍼용 소재에도 세금 혜택을 주기로 한 것이다. 반도체는 워낙 공정이 복잡해 각 단계마다 수없이 많은 소재가 필요한 것을 반영해 웨이퍼 생산과정에서 잉곳을 갈아내거나 깨끗이 닦아내는 소재들에 대해 관세 부담을 낮춰주기로 한 것이다. 반도체 업계의 한 관계자는 “기본적으로 국내 유일의 웨이퍼 제조사인 SK실트론이 혜택을 보겠지만 국내 반도체 공급망 전반에서 관세 상쇄 효과를 누릴 수 있을 것으로 보인다”고 말했다.

[스타트업 창업자 참고 뉴스]

4. ‘모호한 재식별’ 처벌리스크로…CCTV 영상 활용 등 新사업 발목

- 핵심 요약: 중견·중소기업들이 AI 도입한 후 법적 리스크라 불거질 가능성을 우려해 선뜻 사업화에 나서지 못하는 것으로 알려졌다. 실제 유통업 특화 인공지능(AI) 솔루션 기업 A사는 최근 한 중소 유통 업체와의 협업을 추진했지만 계약 직전 무산됐다. A사는 매장 내 CCTV 영상을 분석해 고객의 표정과 동선을 비식별 데이터를 활용해 유리한 상품 배치를 제안하는 사업을 하고 있었다. 그러나 상대 기업은 협의 막판 ‘개인정보 규제 부담’을 이유로 계약을 포기했다. 여기서 ‘비식별 데이터’는 개인정보에서 특정 개인을 알아볼 수 있는 정보를 제거하거나 다른 값으로 대체한 가명정보를 의미하며 개인정보 중 ‘가명정보’와 ‘익명정보’는 개인정보보호법상 서로 다른 법적 지위를 가진다. 익명정보는 상대적으로 규제가 덜하지만, 무엇이 익명정보인지 판단하는 기준이 명확하지 않다는 점에서 기업들은 활용 자체를 꺼리는 상황이다.



5. “기재부가 앞장” AI전환 깃발 든 구윤철

- 핵심 요약: 기획재정부가 정부 부처 가운데 처음으로 직원 대상 인공지능(AI) 실습 심화 교육을 실시한다. 단순한 기초 강의 진행을 넘어 실제 사용자 인터페이스(UI)를 구현하는 응용·실습 중심의 고급 과정을 마련해 공무원들의 AI 활용 능력을 높일 수 있을 것으로 기대하고 있다. 2일 기재부는 다음 주부터 사전 선발된 직원 50명을 대상으로 총 8회 과정의 AI 심화 교육을 시작한다고 발표했다. 교육은 국내 최초의 AI 대학원인 한국과학기술원(KAIST) AI 대학원 교수진이 맡을 예정이며 격주로 시행해 올 12월까지 4개월 동안 진행될 예정이다. 이번 실습형 교육은 구윤철 부총리 겸 기재부 장관의 예산·재정과 경제정책을 모두 다루는 기재부가 AI 전환을 가장 앞장서 실행해야 한다며 AI 활용도를 높일 수 있는 방안을 마련하라는 지시에 따라 추진된 것으로 알려졌다.

6. 파인메딕스, ‘클리어팁’ 2세대 美FDA 승인…글로벌 시장 공략

- 핵심 요약: 파인메딕스가 췌담도 초음파 내시경 조직 채취용 기구 ‘클리어팁’ 2세대가 미국 식품의약국(FDA)으로부터 510(k) 허가를 받았다고 발표했다. 초음파 내시경에서 병변 진단을 위해 조직 샘플을 채취하는 세침흡인술(FNA/B)에 사용되는 기구로 1세대는 이미 2018년 FDA 판매 허가를 획득한 바 있다. 이번 2세대 승인으로 파인메딕스의 FDA 승인 제품군은 총 12개로 늘어났다. 전성우 파인메딕스 대표는 “글로벌 기업들이 장기간 과점해온 시장에서 이번 FDA 승인으로 기술력을 인정받고 제품의 가능성을 증명했다”며 “미국 현지 판매를 위해 유통 파트너사와 계약을 최종 조율하고 있다”고 말했다.

[자주 묻는 질문]

Q. AI 스타트업의 데이터 확보가 왜 이렇게 어려워졌나요?

A. 저작권 비용 급등과 법적 제약 강화가 주요 원인입니다. 책 한 권을 AI 학습용으로 사용하려면 100만 원의 저작권료를 지불해야 하고, 한국은 EU나 일본과 달리 텍스트·데이터마이닝 예외 조항이 없어 모든 저작물에 별도 라이선스가 필요합니다. 또한 공공누리 데이터도 상업적 이용 제한으로 실질적 활용이 어려우며, 개인정보보호법 강화로 CCTV 같은 비정형 데이터 활용 시 재식별 위험이 상존해 기업들이 AI 도입 자체를 포기하는 사례가 급증하고 있습니다.

Q. 정부 지원 정책이 늘어나는데 왜 효과가 제한적인가요?

A. 근본적인 법적 제약이 해결되지 않아 실효성이 떨어지기 때문입니다. 중기부 예산이 16조 8449억 원으로 10.5% 증액되고 반도체 웨이퍼 소재 관세를 0%로 낮추는 등 정부 지원은 확대되고 있습니다. 하지만 저작권법의 TDM 면책 조항 부재, 개인정보 보호 규제 강화, 재식별 처벌 기준의 모호성 등 구조적 문제가 해결되지 않아 스타트업들의 실질적인 AI 도입과 데이터 활용에는 여전히 높은 장벽이 존재합니다. 정책적 지원과 규제 완화가 동시에 이뤄져야 진정한 효과를 볼 수 있습니다.

[스타트업 창업자 핵심 체크포인트]

✓ 데이터 전략 재점검: 고품질 학습 데이터 비용이 급등하는 상황에서 공공 데이터, 자체 생성 데이터, 해외 데이터 소싱 등 다각화된 확보 방안 수립

✓ 법적 리스크 관리: 개인정보보호법 재식별 위험과 저작권법 제약을 사전 검토하고 법무팀 또는 전문 자문 체계 구축으로 AI 도입 시 처벌 위험 최소화

✓ 정부 지원 활용: 중기부 16조 8449억 원 예산 확대와 반도체 관세 혜택 등 정부 정책을 적극 모니터링하고 해당 지원 프로그램 신청으로 비용 부담 경감

✓ 대안 기술 모델: 저작권 부담이 적은 오픈소스 데이터나 자체 데이터 생성 모델 개발로 외부 의존도를 낮추고 지속가능한 AI 사업 모델 구축

[키워드 TOP 5]

AI 데이터 고갈, 저작권 규제 강화, 개인정보보호법 리스크, 정부 지원 확대, 글로벌 인증 전략, AI PRISM, AI 프리즘



9월3(수) 서울경제 1면 언박싱
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널