“국내 주요 병원 10곳이 1400만 명의 환자 데이터를 보유하고 있지만 성별·연령 등 민감한 정보가 포함된 탓에 이를 연구에 활용하는 데는 한계가 있습니다. ‘개인정보 이노베이션 존’은 이런 제약을 극복하고 첨단 의료 사업을 지원하기 위해 구축됐습니다."
이서용 더존비즈온 데이터플랫폼개발 유닛장은 11일 강원도 춘천시에 위치한 더존ICT그룹 강촌 캠퍼스에서 “더존비즈온이 민간 기업 중 처음으로 운영에 나선 개인정보 이노베이션 존은 자본력이 충분하지 않은 스타트업들이 공용으로 데이터를 활용해 혁신적인 인공지능(AI) 모델을 만들기 위해 설립했다"며 이 같이 말했다. 특히 이 시설은 정밀 의료 특화 개인정보 이노베이션 존으로 국내 의료 가명정보 활용의 거점이 될 것으로 기대된다. 현재 서울대병원, 강북삼성병원, 한국과학기술원(KAIST)이 해당 시설에 관심을 보이고 있다.
개인정보 이노베이션 존은 개인정보보호위원회가 가명정보의 안전한 활용을 위해 지난해 처음 도입한 일종의 ‘개인정보 안전지대’다. 가명정보란 개인정보의 일부를 대체해 추가 정보 없이는 특정 개인을 알아볼 수 없도록 처리한 데이터를 뜻한다. 가명정보는 또 다른 정보와 결합되면 AI의 학습에 유용하게 사용될 수 있다. 자칫 개인정보를 식별할 수 있는 탓에 개인정보위가 엄격히 관리한다. 개인정보위는 현재 전국에 5개의 개인정보 이노베이션 존을 설치하고 보다 자유로운 환경에서 데이터를 AI 개발에 활용할 수 있도록 운영 중이다.
개인정보 이노베이션존은 말 그대로 '철통보안'을 유지한다. 인터넷 접속이 불가능하고 테더링 사용도 차단돼 있다. 외부 무단 반출을 막기 위해 데이터를 담은 저장매체(USB) 등 별도의 외부 저장장치도 연결할 수 없다. 평소에는 허가받은 사람 외의 출입을 철저히 통제한다. 가명정보를 분석하기 위한 소프트웨어(SW)도 반입하려면 별도의 심의를 받아야 한다.
개인정보위는 ‘AI 3대 강국’을 이루기 위해서는 안전한 데이터 활용이 필수적인 만큼 개인정보 이노베이션 존이 큰 역할을 할 것이라고 기대하고 있다. 이에 맞춰 개인정보위는 올해 4억 원 규모의 예산을 투입해 기존 5개의 개인정보 이노베이션 존을 올해 6개로 확대 구축한다. 또 개인정보위는 서울·대전·경북 등 각지에 위치한 개인정보 이노베이션 존에서 처리된 가명정보를 클라우드에 축적해 이들을 원격으로 연결하는 방안 등도 검토 중이다. 개인정보위 관계자는 “데이터 관리에 충분한 여력이 안 되는 스타트업 등이 더존비즈온처럼 데이터를 보유한 기관의 시설을 이용할 수 있어 개인정보위도 개인정보 이노베이션 존 구축 및 운영에 역점을 두고 있다”고 강조했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >