“데이터 관련 규제를 획기적으로 완화하지 않으면 지속 가능한 소버린 인공지능(AI)을 갖는 것은 불가능합니다.”
구태언 법무법인 린 변호사는 2일 서울경제신문과의 전화 인터뷰에서 “데이터 문제의 본질은 ‘공급 부족’”이라며 이같이 말했다. 그는 “데이터도 시장이기 때문에 공급이 넉넉하면 가격이 내려가지만, 현재는 공급이 막혀 일부 독점 사업자가 가격을 좌우하는 구조”라며 “현행 개인정보보호법, 저작권법 등은 데이터 유통을 저해해 소상공인의 타깃 마케팅 등 혁신적인 서비스 개발을 가로막고 있다”고 말했다.
구 변호사에 따르면 데이터 규제는 다양한 산업 분야에서 혁신을 가로막고 있다. 의료 분야가 대표적이다. 전자의무기록(EMR)에 기록된 환자의 증상은 진단의 기초이자 AI 학습에 필수적인 데이터다. 그러나 현행 개인정보보호법 해석에 따라 ‘식별 가능성’이 있다는 이유로 증상 기록(Chief Complaint) 전체를 삭제하는 관행이 일반화돼 있다. 이로 인해 AI는 진단명인 ‘감기’나 ‘폐렴’ 같은 결과만 학습할 수 있고, 그에 이르기까지의 증상 변화나 의사의 판단 과정은 반영되지 못한다. 결과적으로 진단 정확도가 떨어지고 의료 AI의 경쟁력도 저하된다.
해외에서는 가명정보의 기준을 명확히 하는 방식으로 기업의 데이터 활용을 적극 권장하는 반면, 국내는 기준이 모호해 기업들이 아예 활용을 포기하거나 데이터를 과도하게 삭제하는 상황이 빈번하다. 구 변호사는 “재식별 정보의 정의가 지나치게 광범위해 AI 개발에 필요한 다양한 데이터를 수집하기 어렵다”며 “고도의 비식별 처리 방식은 오히려 데이터의 가용성을 떨어뜨려 AI 기술 발전을 방해한다”고 비판했다.
이 같은 문제를 해결하기 위해서는 먼저 가명정보와 익명정보의 범위를 명확히 재정의해야 한다. 그는 “같은 정보라도 누가 가지고 있고 어떤 상황에서 활용하느냐에 따라 개인정보인지 아닌지가 달라질 수 있다”며 “정보가 사용되는 맥락을 고려해 식별이 불가능한 경우에는 개인정보가 아닌 것으로 판단하는 방안도 검토할 필요가 있다”고 말했다. 이어 “정보 주체가 직접 공개한 정보에 한해서는 동의 없이 수집·이용할 수 있도록 허용하는 방안도 논의돼야 하고, 온라인 데이터 활용의 법적 불확실성 역시 조속히 해소해야 한다”고 강조했다.
구 변호사는 규제 철학의 전환도 강조했다. “규제의 본질은 오남용을 막는 데 있어야 하는데, 우리는 지금 ‘아예 사용하지 못하게’ 하는 방식으로 가고 있다”며 “개인정보, 저작권, 데이터 관련 규제를 ‘금지’ 중심이 아니라 ‘안전하게 사용할 수 있는 방법’ 중심으로 바꿔야, 데이터가 산업의 원유로 작동하고 AI 경쟁에서도 뒤처지지 않을 수 있다”고 강조했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >