국내 연구진이 딥러닝(심층학습) 창시자이자 인공지능(AI) 4대 석학으로 불리는 요슈아 벤지오 캐나다 몬트리올대 교수와 손잡고 현재 AI 성능 한계를 극복할 수 있는 실마리를 찾았다. 이번 연구는 특히 AI 모델 구동에 드는 비용을 크게 낮춰 고성능 추론 모델이나 에이전트(비서)를 개발하는 데 기여할 것으로 기대된다.
한국과학기술원(KAIST)은 안성진 전산학부 교수와 벤지오 교수 공동 연구팀이 AI 디퓨전(확산) 모델의 ‘추론 시간 확장성’을 크게 개선하는 신기술을 개발했다고 20일 밝혔다. 연구성과는 이달 13일(현지 시간) 벤쿠버에서 열린 제42회 국제기계학습학회(ICML 2025)’에서 전체 채택 논문 중 상위 2.6%에 드는 ‘스포트라이트 논문’으로 발표됐다.
공동 연구는 안 교수와 벤지오 교수가 지난해 9월 설립한 ‘KAIST·밀라(MILA·몬트리올학습알고리즘연구소) 프리프론탈 AI연구센터’를 통해 이뤄졌다. 밀라는 캐나다 몬트리올에 위치한 세계 최대 AI 딥러닝 연구기관이다. 안 교수는 연구센터장으로서 인간 뇌의 고위 인지 능력을 모방하는 AI 기술 등을 연구하고 있다. 공동 연구자인 벤지오 교수는 딥러닝 분야 창시자 중 한명이다. 지난해 노벨 물리학상 수상자 제프리 힌튼 토론토대 교수 등과 함께 AI 분야 세계 4대 석학으로 꼽힌다.
디퓨전 모델은 생성형 AI 모델의 일종으로 이미지 생성 모델 ‘스테이블 디퓨전’처럼 사전에 데이터로 학습하지 않은 결과물도 만들어낼 수 있어 현재 전 세계적으로 널리 쓰이고 있다. AI 모델이 새로운 데이터에서 의미 있는 예측이나 결론을 도출해내는 추론 기술 덕분이다. 이 같은 추론 기술은 AI 모델의 규모나 학습량을 늘리는 데 한계가 있는 상황에서 제한된 자원으로도 성능을 높일 수 있는 신기술로 주목받고 있다.
다만 현재 디퓨전 모델은 추론 시간 확장성이 여전히 부족하다고 평가받는다. 추론 시간 확장성은 AI 모델이 추론에 필요한 시간 등 계산 자원을 효율적으로 쓸 수 있는 능력을 말한다. 가령 모델이 추론에 더 많은 시간을 들이면 더 좋은 결과물을 얻을 수 있지만 지나치게 오랜 시간을 들일 경우 전체적으로 처리 속도는 느려져서 이용자 입장에서는 성능이 떨어진다고 느낄 수 있다. 시간과 품질을 잘 조율하는 식으로 계산 자원 활용을 최적화는 능력인 추론 시간 확장성이 AI 성능 향상의 관건이라는 것이다.
연구팀은 이를 해결하기 위해 ‘몬테카를로 트리 탐색’ 기반의 새로운 새로운 디퓨전 모델 추론 기법을 제안했다. 연구팀은 이 기법이 확산 과정 중 다양한 생성 경로를 트리(나무) 구조로 탐색해 제한된 계산 자원으로도 고품질 출력을 효율적으로 찾아내도록 설계됐다고 설명했다. 이 기법을 적용한 디퓨전 모델은 ‘자이언트 스케일 미로 찾기’라는 작업을 100% 성공률로 수행해냈다. 기존 기법의 성공률은 0%였다.
연구팀은 또 후속 연구를 통해 이 기법을 통한 AI 처리 속도를 100배 높이는 데도 성공했다. 안 교수는 “고비용 계산이 요구되던 기존 디퓨전 모델의 한계를 근본적으로 극복한 기술”이라며 “지능형 로봇, 시뮬레이션 기반 의사결정, 실시간 생성 AI 등 다양한 분야에서 핵심 기술로 활용될 수 있을 것이다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >