국내 정보기술(IT) 및 인공지능(AI) 기업들이 자체 기술로 개발한 거대언어모델(LLM)을 연이어 선보이며, '소버린 AI(자국 인공지능)' 실현을 향한 움직임을 본격화하고 있다. 해당 기업들은 LLM을 오픈소스 형태로 공개해 국내 소버린 AI 생태계 구축에 힘을 쏟는 동시에 한국 사용자 특화 데이터를 기반으로 글로벌 빅테크와의 차별화를 모색하고 있다. 특히 방대한 매개변수 확보 경쟁보다는 모델의 효율성과 사용성, 산업별·사용자별 특화 기능에 초점을 맞춘 실용적 LLM 개발에 주력하는 것도 특징 중 하나다. 나아가 이를 통해 확보한 LLM 관련 원천 기술과 응용 서비스의 완성도를 지속적으로 높여나감으로써 마치 레이싱 경기에서 코너를 공략해 선두를 탈환하는 '코너링 전략'처럼, 글로벌 AI 시장에서 앞서 있는 빅테크들을 추월하겠다는 계획이다.
16일 IT업계에 따르면 국내 IT 기업들이 내놓은 최신 LLM의 성능이 글로벌 주요 오픈소스로 공개된 LLM과 유사한 성능 점수를 기록하고 있다. 특히 한국어 처리 분야에서는 오픈AI의 챗GPT, 메타의 라마, 알리바바의 큐원 최신 모델과 비교해도 우월한 성능을 보여주면서, 소버린 AI 실현에 한발 더 다가갔다.
각 기업의 LLM 개발 전문가들은 소버린 AI 관점에서 자체 LLM 기술 역량 확보가 반드시 필요하다고 강조한다. 신동훈 KT Gen Al랩장(CAIO·상무)은 "해외 빅테크의 LLM과 비교해 기술 격차가 있다고 하더라도, 포기하지 않으면 따라잡을 수 있다고 생각한다"면서 "우리나라가 독립적인 AI 기술을 확보하고 운영해 나갈 수 있도록 생성형 AI 원천 기술을 내재화하기 위해 노력할 것"이라고 말했다.
고품질 데이터 기반 한국어 강점...오픈소스로 AI 대중화 박차
AI 컴퍼니 전환에 박차를 가하고 있는 SK텔레콤(017670)은 최근 자체 기술로 구축한 LLM인 'A.X(에이닷엑스) 3.1 라이트'를 공개했다. 이 LLM은 70억 개의 파라미터(매개변수) 가진 경량 모델이다. 기존 에이닷 전화 통화요약에 적용했던 에이닷엑스 3.0 라이트 모델의 상위 버전으로, 모바일 환경에 최적화돼 있는 것이 특징이다. 또 에이닷엑스 3.1 라이트는 SK텔레콤이 알리바바의 LLM '큐원 2.5'에 데이터를 추가 학습시켜 구축한 '에이닷엑스 4.0 라이트'와 한국어 처리 측면에서 유사한 성능을 보였다.
에이닷엑스 3.1 개발에 참여한 조동연 SK텔레콤 이노베이티브모델 담당은 "한정된 개발 인프라 안에서 최적의 LLM을 개발하기 위해 고도의 효율적인 병렬학습 프레임워크를 개발하고, 꼭 필요한 고품질의 데이터를 잘 선별하는 것에 많은 노력을 기울였다"면서 "글로벌 빅테크가 내놓은 LLM의 모든 영역을 따라갈 수는 없겠지만, 한국어 능력 측면에서는 확실한 우위를 점하는 것에 집중했다"고 설명했다.
SK텔레콤은 에이닷엑스 3.1 라이트는 물론 후속 버전 LLM을 지속적으로 선보임으로써 소버린 AI 생태계 구축에 기여한다는 방침이다. 조동연 담당은 "소버린 AI 생태계 구축을 위해선 오픈소스 형태로 LLM을 공개해 다양한 기업과 기관이 활용할 수 있도록 하는 것이 중요하다"며 "데이터 학습의 효율성을 지속적으로 높임으로써 에이닷엑스의 성능을 고도화해 나갈 것"이라고 말했다.
KT도 자체 개발 LLM인 '믿:음 2.0'을 최근 오픈소스 방식으로 출시했다. 2023년 '믿:음 1.0'을 출시한 이후 약 2년 만에 후속 모델을 선보인 것으로, 115억 개의 매개변수를 갖추고 있으며 한국 특화 지식과 문서 기반 질의 응답 기술을 한층 끌어올린 것이 특징이다. 믿:음 2.0은 국내 교육용 도서와 문학 작품, 법률·특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 방대한 한국 특화 데이터를 확보하는 등 고품질 데이터를 선별해 가공해 탑재한 것이 강점으로 꼽힌다. 조만간 KT는 믿:음 2.0 프로 모델도 출시할 계획이다. 추론 기능을 탑재해 복잡한 명령 처리와 고차원적 질문에 대한 대응 능력도 한층 끌어올린다는 구상이다.
신동훈 KT 상무는 "믿:음 2.0은 개발 단계에서부터 고품질의 한국어 데이터 접목과 한국적 가치 함양, 안전성 확보 등 세 가지를 갖추는 것을 중요하게 봤다"면서 "또 저작권 이슈가 없으면서도 한국 정서를 잘 담을 수 있도록 고품질의 데이터를 확보하는 데 많은 노력을 기울였다"고 설명했다. 이어 "이를 통해 다른 동급 LLM과 비교해 영어 버전에서는 유사한 성능을 나타내고 있고, 한국어 성능에 있어서는 확실한 우위를 점한 것으로 평가하고 있다"고 말했다.
추론 모델도 탑재...글로벌 빅테크 추격 본격화
LG(003550)와 네이버, 업스테이지 등은 언어 모델에 더해 추론 모델까지 선보이며 글로벌 AI 시장에서의 경쟁력을 빠르게 끌어올리고 있다. 추론 모델이 결합되면서 각 LLM은 국가 공인 자격시험을 통과하거나, 시각 정보만으로 답변을 도출하고, 복잡한 수학 문제나 코딩 과제까지 해결할 수 있는 수준으로 진화했다.
특히 지난 15일 LG AI연구원이 공개한 엑사원 4.0 전문가 모델은 자체 기술을 통해 개발한 LLM 중 가장 많은 매개변수인 320억 개를 갖췄다. 매개변수가 큰 만큼 가장 많은 데이터와 지식을 보유하고 있으며, 해석 능력도 탁월할 것으로 예상된다. 이에 LG에 따르면 엑사원 4.0 전문가 모델은 의사, 치과의사, 관세사 등 6가지 국가 공인 전문 자격증 필기시험을 통과하며 높은 수준의 전문성을 나타냈다. LG AI연구원은 해당 모델 전체를 오픈소스로 공개하진 않지만, AI가 데이터를 처리하는 과정을 알 수 있는 가중치를 공개해 수정이나 재배포는 가능하도록 했다.
이진식 LG AI연구원 엑사원랩장(상무)은 엑사원 4.0에 대해 "기존 엑사원을 공개했을 때 받은 피드백을 통해 일반 자연어 처리 능력과 추론 능력을 대폭 향상시켰다"면서 "실제 글로벌 산업 현장에서의 경쟁력을 확보하기 위해 학습 데이터의 전문성을 높이는 데 집중했다"고 말했다.
네이버도 전 세계적인 생성형 AI 시장 트렌드에 발맞춰 자체 기술을 바탕으로 추론 역량을 대폭 강화한 '하이퍼클로바X씽크'를 내놨다. 하이퍼클로바X씽크는 최상급 언어 능력을 갖췄을 뿐 아니라 시각 정보를 바탕으로 추론할 수 있는 기술을 확보한 것이 가장 큰 특징이다. 고난이도의 수학 및 과학 문제를 이미지 형태로 제공했을 때 하이퍼클로바X씽크는 이를 인식하고 추론해 정답을 맞힐 수 있다. 네이버는 해당 LLM을 활용해 동남아, 중동 등 글로벌 진출에도 속도를 높일 계획이다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "자체 기술을 통해 LLM 개발의 효과적인 '레시피'를 확보하는 데에 중점을 뒀다"면서 "단순히 모델 규모를 키워서 성능을 높인 것이 아닌, 동일 또는 유사 규모에서 비용·성능 등이 더 효과적인 모델을 만들어낼 수 있는 기술을 확보했다는 것에 의미가 있다"고 설명했다.
국내 대표 AI 기업인 업스테이지는 앞선 IT 대기업들은 물론 글로벌 빅테크들의 LLM 기술 수준을 능가하는 모델을 출시하면서 국내는 물론 글로벌 시장 개척에 나서고 있다. 최근 업스테이지가 공개한 최신 LLM인 '솔라 프로2'는 논리적 사고를 기반으로 복잡한 문제를 해결할 수 있도록 설계된 프론티어(최첨단)급 차세대 추론형 LLM이다. 기존 모델인 '솔라 프로'의 매개변수 규모인 220억(22B)보다 대폭 늘린 310억 개로 확장해 성능을 향상시켰다. 특히 솔라 프로2의 추론 기술은 수학과 코딩처럼 복잡한 작업에서의 성능을 개선했다. 업스테이지에 따르면 고난도 추론 중심 벤치마크에서 ‘GPT-4o’, ‘딥시크 R1’ 등과 유사한 성능을 보였다.
권순일 업스테이지 부사장은 "프론티어급 성능이 나오는 LLM을 개발하는 것을 목표로 추진했고, 목표 달성에 성공했다고 생각한다"면서 "국내에서는 기술 주권을 지키는 동시에 글로벌 빅테크 중심의 해외에서도 성과를 낼 수 있도록 할 것"이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >