• 뉴스 듣기

  • 글자 크기

    글자 크기 설정

    • 보통

    • 크게

    • 아주 크게

  • 기사 공유

  • 북마크

  • 다크모드

  • 프린트

네이버 채널구독

다음 채널구독

피지컬 AI의 환상과 실재 : 당장의 성공 전략

박종훈 뉴로메카 대표(포스텍 겸임교수·한국AI로봇산업협회 부회장)

입력2026-03-16 11:06

수정2026-03-16 16:10

박종훈

박종훈

뉴로메카 대표

뉴로메카 로봇이 생산 현장에서 작업하는 모습. 뉴로메카
뉴로메카 로봇이 생산 현장에서 작업하는 모습. 뉴로메카

최근 로봇 업계의 화두는 단연 ‘피지컬 AI(Physical AI)’다. 챗GPT가 디지털 세상의 언어 장벽을 허문 것처럼, 이제는 인공지능이 물리적 실체와 결합하여 스스로 판단하고 행동하는 로봇 파운데이션 모델(RFM)이 산업의 지형도를 바꾸려 하고 있다.

하지만 장밋빛 환상과 냉혹한 산업 현장 사이에는 여전히 극복해야 할 기술적·경제적 간극이 존재한다. 데이터 기반의 ‘뇌’는 비약적으로 발전했지만, 이를 실제 근육과 신경으로 연결하는 과정은 또 다른 차원의 문제다. 자동화를 필요로 하는 고객은 늘 같은 고민을 얘기한다. ‘과연 피지컬 AI를 ‘지금 당장’ 우리 공장에 넣을 수 있는가?‘ 우리는 이제 고객의 질문에 답해야 한다.

‘아틀라스’가 제시한 로드맵의 함의

최근 현대자동차그룹은 보스턴 다이내믹스의 휴머노이드 로봇 ‘아틀라스’를 활용한 야심 찬 산업 적용 로드맵을 공개했다. 2028년 미국 조지아주 메타플랜트(HMGMA)의 부품 분류 및 서열 작업 투입, 그리고 2030년 의장 라인의 부품 조립 투입이 골자다. 여기서 주목할 점은 2028년과 2030년 사이의 기술적 난이도 차이다. 분류와 서열은 규격화된 팔레트 위에서 이루어지지만, 의장 라인은 인간 노동자의 정교한 ‘암묵지’가 가장 많이 필요한 자동화율이 가장 낮은 공정이기 때문이다.

이를 달성하기 위해서는 세 단계 진화가 필수적이다. 1단계는 복잡한 환경에서 수많은 사물을 정확하게 식별하는 기능 (Vision)이다. 2단계는 0.1mm 오차 범위 내에서 정밀하게 위치를 잡고 움직이는 기능(Motion)이다. 3단계는 로봇 핸드를 이용해 인간처럼 유연하고 다재다능하게 물체를 조작하는 기술 (Manipulation)이다.

여기서 근본적인 의문이 생긴다. 현대차나 테슬라 같은 거대 기업은 수조 원의 자본을 투입해 3~4년 뒤의 장기 목표를 설계할 수 있다. 하지만 ‘데이터 갈증’을 해소할 막대한 자본과 인력이 부족한 대다수 중소 AI·로봇 기업들에게 VLA 중심의 ‘올인’ 전략은 매우 위험한 선택이 될 수 있다. 당장의 성과 없이 거대 모델 학습에만 매몰되거나 성공 확률이 낮은 로봇 핸드 제조에만 집중하는 것은 자칫 기술적 고립을 초래할 뿐이다. 지금 우리에게 필요한 것은 거대 기업을 무작정 쫓기보다 실리를 챙기는 ‘영리한 우회 전략’이다. 중소 로봇 기업일수록 ‘손에 잡히는’ 중단기적 성과를 내기 위한 최적의 경로 설정이 절실하다.

정밀 제어의 인공지능화 : ‘시스템 0’의 등장

최근 실리콘밸리의 피규어(Figure)사가 발표한 ‘Helix 02’ 아키텍처는 기술적 패러다임의 중대한 변화를 보여준다. 이전까지 로봇의 균형과 안정성은 10만 줄 이상의 수동 C++ 코드로 짜여진 고전적 제어 알고리즘에 의존해 왔다. 그러나 Figure AI는 이를 과감히 삭제하고, 1,000만 개의 파라미터를 가진 신경망 기반의 ‘시스템 0(System 0)’ 레이어를 추가했다.

이는 인지적 판단을 거치지 않는 무의식적 반응을 AI로 구현한 것이다. 외부 충격이나 불규칙한 표면에서도 작업의 연속성을 보장하는 물리적 맷집의 핵심이다. 시스템 2가 논리적 추론을 하고 시스템 1이 시각-운동을 협응한다면, 시스템 0은 초당 1000회 고속 루프에서 물리적 안정성과 접촉 역학(Last 0.1mm)을 책임진다. 로봇이 무거운 식판을 들고 걸을 때 발생하는 무게 중심의 미세한 변화를 AI가 ‘직관’적으로 보정하는 것이다. 정밀 제어의 영역까지 AI가 확대되고 있다는 것은 정밀함이 곧 로봇 자동화의 핵심이라는 인식의 전환을 의미한다.

휴머노이드 로봇이 스스로 조립하고 수리하는 모습을 묘사한 AI 이미지.
휴머노이드 로봇이 스스로 조립하고 수리하는 모습을 묘사한 AI 이미지.

현재의 기술로 당장 성과를 내는 법: PSF 전략

우리는 VLA를 하나의 거대한 ‘블랙박스’로 보고 모든 것을 한꺼번에 해결하려는 유혹에서 벗어나야 한다. 현재 멀티모달 LLM과 비전 파운데이션 모델(VFM)은 이미 산업 현장을 ‘보고 이해하는 기능’을 상당 부분 담당할 수 있을 만큼 성숙해 있다. 문제는 2단계(정밀 동작)와 3단계(다재다능한 조작)를 데이터 중심의 학습으로만 풀려다 보니 학습 데이터 부족으로 실증이 지연된다는 점이다.

로봇 핸드를 이용한 고난도 조작은 여전히 연구 단계에 가깝고 경제성 확보도 쉽지 않다. 그렇다면 지금 당장 성과를 내기 위해 선택할 수 있는 실리적인 우회 전략은 무엇인가? 바로 1단계(VFM)의 인지 지능과 2단계(로보틱스 기반 정밀 제어)의 물리 지능을 명확히 구분하여 결합하는 ‘피지컬 스킬 파운데이션(PSF)’ 기법이다.

스킬의 조합, 산업 자동화의 새로운 문법

PSF는 ‘잘 보고’ ‘잘 움직이는’ 액션(Action) 단위의 기능 블록들을 다수 확보하고, 이를 조합해 재사용 가능한 ‘스킬(Skill)’을 구현하는 것이다. 스킬은 단순히 액션을 순서대로 나열하는 것이 아니다. 액션들 간의 논리적 구조를 결합한 ‘거동 트리(Behavior Tree)’가 스킬의 본질이다. 예를 들어, 부품을 집어 좁은 틈에 끼우는 작업 중 미세한 오차가 발생한다면, 로봇은 단순히 멈추는 것이 아니라 거동 트리의 실패 복구 로직에 따라 즉시 ‘재인식’ 또는 ‘힘 기반 미세 조정’ 단계로 회귀한다. 이러한 ’실패 인지 및 보정‘ 기능이 통합될 때 비로소 AI 로봇은 공장 라인을 멈춰 세우지 않는 신뢰할 수 있는 설비가 된다. 이 기법을 활용하면 현재 수준의 AI 기술로도 충분히 복잡한 산업 공정을 자동화할 수 있다.

향후, 로봇은 환경과 작업을 스스로 이해하고, 작업에 필요한 스킬과 액션을 스스로 구성하게 될 것이다. 이 때가 되면 로봇은 스스로 작업을 이해하고 실행할 수 있게 될 것으로 기대한다. 우리가 지향하는 단기적 목표는 이것이다.

뉴로메카의 피지컬 스킬 파운데이션 모식도.
뉴로메카의 피지컬 스킬 파운데이션 모식도.

지능의 거품 걷어내고 ‘사례’ 통해 신뢰 구축해야

앞으로의 2~3년은 로봇 산업 역사상 가장 급격한 변곡의 시대가 될 것이다. 우리에게 필요한 것은 현장에서 즉시 작동하고 가치를 만들어내는 ‘실체적 피지컬 AI’다.

원대한 미래형 휴머노이드 개발도 중요하지만 당장 제조 현장의 페인 포인트(Pain Point)를 해결할 수 있는 모듈형 스킬 파운데이션을 구축해야 한다. 환경을 스스로 이해하고 스킬을 생성하는 날이 오기 전까지 우리는 검증된 기술의 유연한 조합을 통해 100%의 신뢰성을 확보해야 한다. 결국 ’신뢰성‘이 곧 ’생존력‘이자 ’경쟁력‘이다.

AI의 환각이 단순히 오답에 그치지 않고 물리적 파손과 인명 사고로 이어질 수 있는 로봇 분야에서, ’실패를 스스로 인지하고 복구하는 능력‘은 향후 세계 표준을 주도할 강력한 무기가 될 것이다. 지능의 화려함에 매몰되기보다 현장에서 증명되는 정밀한 복원력에 집중하는 것, 그것이 대한민국 로봇 산업이 글로벌 선두 그룹으로 도약하는 가장 확실한 길이다.

박종훈의 피지컬 AI와 로봇
박종훈의 피지컬 AI와 로봇

이 기사를 추천합니다.

ⓒ 서울경제신문, 무단 전재-재배포, AI 학습 및 활용 금지

다음
이전
다음
이전