
휴머노이드 로봇의 미래를 두고 글로벌 빅테크와 중국 제조업체가 완전히 다른 해답을 내놓았습니다. 미국 실리콘밸리에서 열린 ‘휴머노이드 서밋’ 무대에서 구글과 샤오펑은 같은 목표를 향해 전혀 다른 길을 제시했습니다.
- ➤ 구글: 범용 AI ‘두뇌’를 모든 로봇에 공급
- ➤ 샤오펑: 인간에 가까운 하드웨어 + 온디바이스 AI
- ➤ 소프트웨어 플랫폼 vs 수직 통합 양산 전략
구글: “로봇의 본질은 지능이다”
구글 딥마인드 로보틱스는 발표 시작부터 하드웨어보다 ‘지능’을 전면에 내세웠습니다. 현재 로봇이 특정 환경과 작업에만 최적화돼 있어 새로운 작업을 수행하려면 긴 개발 시간이 필요하다는 점을 한계로 지적했습니다.
구글의 해법은 AI 파운데이션 모델 ‘제미나이 1.5’를 로보틱스에 접목하는 것입니다. 이를 통해 로봇이 시각·언어·행동을 통합적으로 이해하는 VLA(Visual-Language-Action) 모델을 구현했습니다.

‘교차 신체 학습’이 보여준 범용성
특히 눈길을 끈 개념은 교차 신체 학습입니다. 휴머노이드, 4족 보행 로봇, 양팔 로봇 등 서로 다른 형태의 데이터를 하나의 모델로 학습시켜 경험하지 못한 동작까지 일반화할 수 있도록 했습니다.
시연에서는 로봇이 처음 보는 농구공을 보고도 “슬램덩크를 하라”는 명령을 이해해 200ms 만에 판단·행동을 수행했습니다. 단순 동작을 넘어 규칙 검색, 분류, 다단계 추론까지 가능하다는 점을 강조했습니다.
“구글은 로봇을 만들기보다, 로봇의 두뇌를 만들고 있다.”
샤오펑: “인간과 닮지 않으면 휴머노이드가 아니다”
반면 중국 샤오펑은 정반대의 접근을 택했습니다. 목표는 단순한 지능이 아니라 외형·움직임·소통까지 인간과 유사한 로봇입니다.
샤오펑은 거대 언어 모델을 그대로 이식하는 방식이 아니라, 배터리·발열·지연 시간 같은 하드웨어 제약을 고려해 소프트웨어와 하드웨어를 처음부터 함께 설계하는 전략을 강조했습니다.
뇌와 척수를 나눈 구조
샤오펑의 로봇 아키텍처는 뇌 역할의 VLT(Vision-Language-Time·Task)와 척수 역할의 VLA로 나뉩니다. 고차원 명령과 실제 관절 제어를 분리해 돌발 상황에서도 즉각 대응할 수 있도록 설계됐습니다.
실제 시연에서는 이동 중 물병을 떨어뜨리는 상황에서도 로봇이 계획을 수정해 다시 집는 모습을 보여 현실 환경 대응력을 강조했습니다.
결정적 차이: 상용화 시점
가장 큰 차이는 일정입니다. 샤오펑은 2026년 말 대량 생산이라는 명확한 목표를 제시했습니다. 초기에는 자사 자동차 대리점과 공장에서 고객 응대·부품 운반 등 실제 업무에 투입할 계획입니다.
구글이 플랫폼 제공자로서 생태계 확장을 노린다면, 샤오펑은 테슬라와 유사한 수직 통합 모델로 물리적 제품 완성을 서두르고 있는 셈입니다.
휴머노이드의 승자는 누구일까
이번 서밋은 한 가지를 분명히 보여줍니다. 휴머노이드의 미래는 하나의 정답이 아니라 두 개의 길 위에 서 있다는 점입니다. 범용 지능을 장악하는 플랫폼 기업이 이길지, 실제로 움직이는 ‘몸’을 먼저 시장에 내놓는 기업이 앞설지는 상용화 단계에서 판가름 날 가능성이 큽니다.
'생활정보' 카테고리의 다른 글
| “덜 해로운 담배는 없다”… 모든 니코틴 제품, 심혈관 독성 경고 (1) | 2025.12.24 |
|---|---|
| “정가 5만원인데 15만원?” 크리스마스 앞두고 성심당 케이크 리셀 논란 (0) | 2025.12.24 |
| 오늘부터 휴대전화 개통할 땐 ‘얼굴 인증’ 필수…왜 바뀌었을까 (0) | 2025.12.23 |
| 커피값 왜 이렇게 오르나 했더니…국내 커피 수입액 ‘2조원 시대’ (0) | 2025.12.23 |
| “그냥 겨울 간식인 줄 알았는데”…밥보다 낫다는 음식의 정체 (0) | 2025.12.22 |