전체메뉴

검색
팝업창 닫기
이메일보내기

저화질 사진도 척척 인식…AI 정확도 높이는 ‘데이터 증강법’ 찾았다

UNIST, 전미인공지능학회 채택

AI, 학습 데이터와 다르면 성능↓

변형 데이터 추가 학습시켜 보완

데이터 증강을 최적화하는 과정. 사진 제공=UNIST




저화질 의료 사진만으로도 암을 진단하는 등 한정된 데이터 학습으로도 인공지능(AI) 모델의 정확도를 높일 수 있는 방법을 국내 연구진이 밝혀냈다.

울산과학기술원(UNIST)은 윤성환 AI대학원 교수 연구팀이 AI 학습의 필수 단계인 데이터 증강이 모델의 강건성을 높이는 조건을 수학적으로 증명했다고 20일 밝혔다. 연구성과는 20일(현지 시간) 싱가포르에서 열리는 세계적 AI 학술대회 ‘전미인공지능학회(AAAI)’에 정식 논문으로 채택됐다.

AI 모델은 학습한 데이터와 조금만 다른 환경에 노출돼도 성능이 급격히 떨어지는 문제가 있다. 의료 AI가 저화질 사진을 보고 제대로 진단하지 못하거나 자율주행 AI가 눈보라 속에서 도로 상황을 제대로 인식하지 못하는 일이 벌어질 수 있다.



데이터 증강을 통해 저화질이나 눈보라 같은 ‘변수’를 추가로 학습함으로써 이 같은 문제를 보완할 수 있다. 데이터 증강은 원본 데이터에 인위적으로 변형을 가해 AI 모델의 학습량을 늘리는 과정이다. 다만 데이터를 어떻게 변형하는 게 가장 효과적인지 아직 명확히 규명되지 않았다.

연구팀은 ‘근접 지지 증강(PSA)’ 조건을 만족하는 방식이 최적의 데이터 증강이라는 사실을 증명했다. PSA는 원본 데이터에 미세한 변형을 가해 원본 데이터 주변을 촘촘히 채우는 증강 방식이다. 연구팀은 먼저 데이터 공간과 파라미터 공간에서 변화가 서로 대응된다는 점을 증명한 뒤 PSA 조건을 만족하는 데이터 공간에서의 변화가 파라미터 공간의 손실함수 지형도 평평하게 다져준다는 사실을 입증했다. 입력 데이터 주변을 촘촘히 채우면, 이에 대응하는 모델 내부의 파라미터 공간도 평평해져 AI가 강건성을 갖추게 되는 것이다.

연구팀은 “데이터 증강 설계를 보다 체계적인 과학으로 만든 연구”라며 “자율주행, 의료 영상, 제조 검사처럼 분포가 자주 바뀌는 실제 환경에서 신뢰할 수 있는 AI 모델을 만드는 데 중요한 이론적 기반이 될 것이다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널