리벨리온이 글로벌 오픈소스 솔루션 선도기업 '레드햇(Red Hat)'과 함께 '리벨리온 NPU 기반 레드햇 오픈시프트 AI'를 공개한다고 11일 밝혔다. 이 솔루션은 '레드햇 오픈시프트 AI'와 리벨리온의 NPU, 고효율 추론 엔진인 vLLM(LLM 성능 향상 SW)을 결합해 검증된 풀스택 엔터프라이즈 AI 플랫폼을 제공한다.
리벨리온 NPU 기반 레드햇 오픈시프트 AI는 AI 추론 최적화를 위해 핵심 요소를 통합해, 하드웨어(NPU)는 물론 모델 서빙(vLLM)까지 추론에 필요한 모든 영역을 아우르는 검증된 풀스택 AI 추론 플랫폼이다. 리벨리온은 이 플랫폼이 다양한 환경에서 안정적이고 효율적인 추론 인프라를 구축할 수 있는 대안이 될 것으로 기대하고 있다.
또 이 플랫폼은 고객의 AI추론 최적화를 위한 핵심 요소를 통합했다. 리벨리온의 NPU는 AI 추론에 최적화된 아키텍처로 설계돼 기존 GPU 대비 최대 3.2배 더 높은 에너지 효율성을 제공하며 서버·랙 단위에서 데이터센터의 구축 및 운영 비용을 효과적으로 낮춰준다. 또 풀스택 소프트웨어와 주요 오픈소스 AI 프레임워크 지원을 통해 GPU와 동일한 수준의 편리한 개발 환경을 제공한다.
이를 바탕으로 하드웨어부터 모델 서빙까지 모든 영역을 아우르는 검증된 풀스택 AI 추론 플랫폼을 제공한다. 리벨리온의 소프트웨어 스택은 ‘레드햇 오픈시프트 AI’에서 최적화되어 실행되며 오버헤드를 줄이고 배포를 가속화하는 것이다.
해당 플랫폼은 주요 기능은 △확장 가능한 엔터프라이즈급 AI 지원(vLLM 통합으로 고처리량·저지연·고효율 추론 운영) △보안 강화 및 규제 준수(온프레미스 기반 데이터 보호 및 요건 대응) △운영 단순화(NPU를 GPU처럼 쉽게 운영할 수 있는 통합 관리 환경) △유연한 확장성(코어부터 엣지까지 선형 확장이 가능한 인프라) 등이다.
박성현 리벨리온 대표는 “AI서빙과 추론이 본격화되며 기업들은 성능과 비용, 데이터 주권을 모두 만족시키는 실용적인 인프라를 필요로 하고 있다"며 "이번 협력으로 레드햇과 리벨리온은 AI 추론의 요소가 제각각이던 기존 방식 대신 하드웨어부터 모델서빙까지 오픈소스를 이용하여 통합되고 검증된 추론 플랫폼을 제공한다"고 말했다. 이어 "이로써 기업들이 보다 효율적이고 안전하게 AI서비스를 확장할 수 있도록 지원하는 한편, GPU 중심의 환경을 넘어 NPU 기반 추론 인프라의 새로운 대안을 제시하는 첫 사례가 될 것"이라고 밝혔다.
브라이언 스티븐스 레드햇 AI 부문 수석부사장 겸 CTO는 "엔터프라이즈 AI의 미래는 단일 구조의 독점 스택을 넘어서는 아키텍처를 선택할 수 있어야 한다"며 "리벨리온과의 협업은 레드햇의 '모든 모델, 모든 가속기, 모든 클라우드' 전략을 구현하는 데 있어 큰 의미가 있다"고 설명했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >





ryupro@sedaily.com








