업스테이지의 최신 대규모언어모델(LLM) ‘솔라 프로2’가 글로벌 인공지능(AI) 분석 기관으로부터 성능과 가격 경쟁력 측면에서 모두 높은 평가를 받았다. 이로써 솔라 프로2는 엑스에이아이(xAI)의 ‘그록4’, 오픈AI의 ‘챗GPT’, 앤스로픽의 ‘클로드’ 등 세계 최고 수준의 모델들과 어깨를 나란히 하게 됐다. 특히 xAI 창업자인 일론 머스크가 관련 소식을 자신의 소셜네트워크서비스(SNS)를 통해 공유하며 더욱 큰 주목을 끌었다.
20일 정보기술(IT) 업계에 따르면 업스테이지의 솔라 프로2는 글로벌 AI 분석 기관 ‘아티피셜애널리시스’의 ‘지능 지표(Intelligence Index)’에서 58점을 획득해 전체 12위를 기록했다. 기업 기준으로는 업스테이지가 전 세계 상위 10위권에 포함됐으며 이는 한국 기업 중 첫 사례다.
아티피셜 애널리시스는 이번 발표에서 총 20위까지 지능 지표를 공개했는데 문샷AI가 개발한 ‘키미 K2’와는 같은 점수를 기록했으며, 라마4 ‘매버릭(51점)’과 ‘스카우트(43점)’를 가뿐히 제쳤다. 가장 높은 점수를 차지한 서비스는 xAI의 ‘그록4(73점)’였으며 오픈AI의 ‘o3-프로(71점)’, 구글의 ‘제미나이 2.5 프로(70점)’, 딥시크의 ‘R1(68점)’ 등도 상위권에 이름을 올렸다.
또 아티피셜애널리시스는 해당 지능 지표를 발표하며 자사 SNS를 통해 업스테이지의 솔라 프로2를 직접 소개했다. 아티피셜애널리시스는 SNS 게시물에서 “솔라 프로2는 310억 개의 매개변수를 보유하고 있는 모델로 크기에 비해 놀라운 성능을 보여준다”면서 “‘생각’ 모드에서는 ‘클로드4 소넷’에 근접하는 지능을 갖춘 동시에 가격 경쟁력도 뛰어나다”고 평가했다.
해당 게시물은 19일 머스크가 직접 공유하면서 솔라 프로2의 탁월한 성능에 대한 평가가 전 세계로 확산됐다. 머스크는 솔라 프로2의 성능을 호평한 게시물을 인용하면서도 “xAI의 그록은 여전히 1위이며 빠르게 개선되고 있다”고 언급해 자사 모델의 우위를 강조했다. 아티피셜애널리시스는 이전 게시물에서 솔라 프로2를 ‘가장 가격 경쟁력이 뛰어난 모델’로 선정한 반면 그록4는 ‘가격 경쟁력이 가장 낮은 모델’로 평가한 바 있다. 머스크는 이러한 평가를 의식한 듯 성능 측면에서는 여전히 우위에 있다는 것을 부각하는 반응을 보인 것으로 풀이된다.
이로써 업스테이지는 이번 평가를 계기로 글로벌 시장에서 기술력과 가격 경쟁력을 동시에 인정받는 한국 대표 AI 기업으로 부상했다. 김성훈 업스테이지 대표는 SNS를 통해 “공신력 있는 글로벌 모델 평가 기관의 지표에 등록되면서 솔라 프로2가 글로벌 주요 LLM보다 좋은 성능을 낸 것을 확인할 수 있었다”면서 “머스크가 게시물을 공유하면서 더욱 많이 홍보가 된 것 같다”고 말했다.
솔라 프로2가 이처럼 전 세계에서 주목받을 수 있었던 것은 업스테이지가 현실과 타협하지 않고 프런티어(최첨단)급 LLM 개발에 집중해온 덕분이다. 솔라 프로2는 단순한 텍스트 생성 능력을 넘어 논리적 사고를 기반으로 복잡한 문제를 해결할 수 있도록 설계됐다.
특히 솔라 프로2는 개발 단계에서 빅테크 범용 LLM과 유사한 성능을 내면서도 특정 테스크에 잘 쓰일 수 있도록 하는 비용 효율 측면을 동시에 고려했다. 실제로 솔라 프로2는 ‘종합지식’ ‘수학’ ‘코딩’ 등 고난도 추론 중심 벤치마크에서 ‘챗GPT’와 ‘딥시크 R1’ ‘큐원3’ 등에 버금가는 성능을 보이기도 했다.
권순일 업스테이지 부사장은 “데이터 처리 방법론이나 학습 방법론의 노하우를 바탕으로 한정된 자원 안에서 높은 성능을 내는 LLM을 개발하는 데 집중했다”면서 “글로벌 최신 모델들과 비교해 성능 격차가 크지 않으며 프런티어급 LLM 개발이라는 목표를 바탕으로 지속적으로 고도화해나갈 것”이라고 설명했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >