피지컬AI의 심장 ‘저전력 NPU’…K스타트업, 전용칩 개발 도전장
NPU, 특정 분야서 AI모델 돌려 추론
GPU 대비 전력·비용 절감 장점으로
‘기기서 연산 수행’ 피지컬AI에 필수적
저전력서도 고성능 AI 가동할 칩 필요
AI 추론시장 2030년엔 2549억弗 전망
美·中·이스라엘 정도만 개발역량 갖춰
“정부, 국내 기업 NPU 적극 활용하고
개념검증으로 美·동남아 판매 지원을”
입력2026-04-22 17:27
수정2026-04-22 23:33
지면 16면
제조 공장에서 휴머노이드로봇이 사람 대신 무거운 박스를 옮긴다. 전장에서는 드론이 적을 인지해 자동 공격한다. 자동차는 운전자 없이 도로 위 상황을 실시간으로 파악해 방향, 속도 등을 조절하며 움직인다. 이같이 현실에서 움직이고, 판단하고, 행동하는 피지컬 인공지능(AI)는 AI 기술이 발전할수록 실제 생활에서 사람을 대신해 더 많은 작업을 수행하게 된다.
이를 가능하게 하는 여러 요인 중 하나가 신경망처리장치(NPU) 칩이다. 기존 컴퓨팅에 쓰던 칩은 전력, 발열 등의 문제로 피지컬AI에 그대로 적용되기 어렵다. 전력난, 통신장애 등으로 현실에서 각종 피지컬AI 장치들이 오작동할 경우 대형 사고가 발생할 수도 있다. 이를 해결하기 위해 국내 스타트업들이 앞다퉈 NPU 개발 및 양산에 착수하고 있다.
데이터 이동 횟수 최소화 구현
AI 모델을 개발하기 위해서는 데이터 학습이 필수적이다. 이를 위한 반도체로 현재 많이 사용되는 게 그래픽처리장치(GPU)다. GPU는 이미지를 처리하기 위한 용도에서 시작됐다. GPU 내 두뇌 역할하는 코어들이 대용량 데이터를 동시에 처리하는 데 적합한 것으로 뒤늦게 확인되면서 AI 모델 개발에 활용됐다.
오픈AI의 챗GPT가 등장한 이후 더 많은 데이터를 학습시켜 AI 모델을 고도화하는 작업에 불이 붙었다. 많은 데이터를 학습시키기 위해 데이터가 수천만 번 왔다 갔다 하면서 전력 소비가 증가하고 칩이 뜨거워지는 문제가 발생했다. 그 결과 칩 성능이 떨어지는 부작용도 이어졌다. GPU 한 장에 수천만 원을 호가하는 점도 부담으로 작용한다. 대용량 데이터 처리가 필요한 다양한 산업군에서 GPU 성능이 검증됐지만 그로 인한 전력, 비용 등은 치명적인 단점으로 꼽히는 것이다.
이같은 한계를 보완하는 게 바로 NPU다. NPU는 GPU 대비 데이터의 이동을 최소화한 구조 등으로 설계된다. 이를 통해 특화된 알고리즘 실행에 최적화했다. 즉, GPU가 다양한 분야에서 데이터를 학습시켜 AI 모델을 만들고 이를 작동하는 것까지 모두 가능했다면 NPU는 특정 분야에서 AI 모델을 돌려 추론하는 작업에 적합하게 구현됐다. NPU가 GPU 대비 전력과 비용을 대폭 줄일 수 있는 이유다. 실제로 딥엑스, 모빌린트, 하이퍼엑셀은 각사의 NPU 칩들을 GPU 대비 3분의 1에서 10분의 1 낮은 전력에서 작동되도록 설계했다.
저전력으로 작동하는 NPU는 피지컬AI에서 필수적이다. 피지컬AI의 대부분은 모든 데이터를 데이터센터를 통해 서버로 전송하고 받는 게 아니라 기기에서 즉각 연산작업을 수행하는 온디바이스형으로 구현되기 때문이다. 김주영 하이퍼엑셀 대표는 “데이터센터는 전기를 많이 쓸 수 있는 반면 웨어러블 디바이스, 모바일은 1와트, 가전제품 로봇은 10와트, 차량은 100와트 미만의 전력을 써야 한다”며 “전력 기준을 맞추면서 가격 단가까지 충족시키려면 특화된 칩을 쓸 수밖에 없다”고 했다. 김녹원 딥엑스 대표는 “현대자동차그룹에서 배달용 로봇 ‘달이’에 GPU를 썼는데, 발열이 심하고 배터리가 빨리 닳는 반면 가격은 비싸 양산 불가로 판정했다”며 “LTE모드도 도입했지만 통신이 끊기면 로봇이 작동하지 않게 돼 온디바이스 반도체 칩이 필요하다고 결론 내렸다”고 언급했다.
가성비·전성비에 호환성까지 갖춰야
피지컬AI가 부상할수록 NPU의 수요는 크지만 정작 이를 개발하는 건 쉽지 않다. 업계 관계자들은 반도체 개발이 ‘종합예술’이라고 입을 모았다. 각종 하드웨어뿐만 아니라 소프트웨어 등을 모두 갖춰야 해 개발 난이도가 높다는 이유에서다. 칩이 개발돼도 개발자들이 이를 작동할 소프트웨어를 익히기 어렵다면 해당 칩은 시장에서 외면받을 가능성이 높다. GPU 시장의 80%가 엔비디아가 차지하고 있는 만큼 업계가 NPU 활용법을 엔비디아의 소프트웨어 플랫폼에 맞춰 유사하게 구현하는 데 주력하는 것도 이같은 이유에서다.
가성비, 전성비(전력 대비 성능), 호환성, 안정성 등을 모두 확보해야 하는 점도 업계로선 부담이다. 신동주 모빌린트 대표는 “NPU를 기존 다른 칩과 함께 쓰는 식으로 활용할 경우 다른 칩들과 호환해서 잘 작동돼야 한다”며 “윈도우, 리눅스도 지원할 수 있어야 한다”고 설명했다.
반도체의 특성상 기술적으로 칩을 구현한다 해도, 안정적으로 대량 생산을 담보할 수 없다. 국내 NPU 스타트업들은 삼성전자 파운드리사업부와 TSMC에서 각사 칩들을 양산하고 있다. 신 대표는 “적게는 수백억 원에서 많게는 수천억 원의 비용을 들여 NPU를 양산에 성공해도 그 사이 AI 시장이 빠르게 바뀌어 트렌드를 놓칠 수 있다”며 “보통 구매 주문을 받고 칩을 양산하는 것과 달리 NPU는 주문을 받기도 전에 양산해 동시에 판매하고 있다”고 했다.
韓 NPU 개발 경쟁력에 선도 가능성
NPU 개발의 어려움에도 국내 스타트업들이 NPU 시장에 뛰어드는 데는 AI 추론 시장이 커지고 있기 때문이다. 글로벌 시장조사기관 마켓앤드마켓츠에 따르면 AI 추론시장은 2030년 2549억 달러로, 지난해부터 연평균 19%씩 성장할 것으로 전망된다. AI 추론시장이 커질수록 이를 겨냥한 칩인 NPU의 수요도 커질 가능성이 높다. 김주영 대표는 “엔비디아의 시가총액 5000조 원 중 NPU가 1%만 확보해도 50조 원”이라며 “엔비디아, 구글 등 빅테크도 AI 전용 칩에 집중하고 있어 본격적으로 경쟁이 치열해질 것”이라고 내다봤다.
NPU가 GPU를 완전히 대체하는 게 아니라 GPU를 보완하는 것만으로도 시장성이 충분하다는 주장이다. 고범석 딥엑스 전략마케팅 이사는 “피지컬AI 시장은 엔비디아가 장악한 클라우드 및 서버 시장과는 본질적인 문법 자체가 다르다”며 “엔비디아가 소프트웨어, 아키텍처를 수정하더라도 저전력·저비용의 장벽을 넘는 것은 하드웨어의 근본적인 설계 유전자를 바꾸지 않는 한 불가능에 가깝다”고 지적했다.
NPU를 개발할 수 있는 국가로 한국을 비롯해 미국, 중국, 유럽, 이스라엘, 대만 등 소수에 그치는 점은 한국에 유리한 요소다. AI를 잘 활용하면서 동시에 하드웨어, 소프트웨어 기술력을 갖춘 국가가 몇 안되는 탓이다. 업계에서는 미국 정부가 중국, 러시아에 대한 GPU 수출을 제한하고 있는 점에도 주목하고 있다. 이로 인해 중국에서는 NPU에 높은 관심을 쏟고 있다.
현재 한국 정부는 ‘K엔비디아 육성’ 프로젝트의 일환으로 NPU 양산 및 차세대 AI 반도체 개발사업을 지원하고 있다. NPU 스타트업들은 진정한 소버린(기술주권) AI는 데이터와 AI 모델뿐만 아니라 인프라까지 갖춰야 하는 만큼 정부가 국내 기업들이 양산하는 NPU를 적극 활용해줄 것을 촉구하고 있다. 김주영 대표는 “정부가 GPU 26만 장 확보했는데 NPU도 1만 장 정도 확보해야 한다”며 “정부가 먼저 국내 기업의 개념검증(POC)을 해주면 미국뿐만 아니라 동남아에서 기업들이 칩을 판매하는게 수월해질 것”이라고 강조했다. 고 이사도 “반도체는 설계의 우수성만큼이나 실제 현장에서 24시간 안정적으로 구동되는지 확인하는 ‘트랙 레코드’가 중요하다”고 주장했다.
이 기사를 추천합니다.
ⓒ 서울경제신문, 무단 전재-재배포, AI 학습 및 활용 금지