로봇 기업 성패 가르는 세계적 난제로 ‘슬롯사이트 수집·활용 문제’ 부상
갤럭시아·러쥐·루모스로보틱스 등 中업체 슬롯사이트셋 경쟁 달아올라
* 이 기사는 로봇신문 주간지 ROBOT PLUS Ver.24(2026. 1. 26일자)에 게재된 내용입니다.
산업 시대에 석유가 핵심 동력이었다면, 데이터는 AI 시대의 ‘피지컬 AI·체화 지능(Embodied Intelligence)’ 폭발을 이끄는 핵심 연료가 되고 있다. 자율주행 산업이 데이터 부족 단계에서 대규모 상용화로 진화해 온 경로를 되짚어보면, 2026년은 알고리즘의 돌파, 연산 능력의 비약, 하드웨어 성숙 이후 ‘데이터’라는 요소가 본격적으로 경쟁력을 좌우하는 시점이 될 것으로 보인다.
그동안 상대적으로 과소평가돼 왔던 슬롯사이트 수집과 활용 문제가 이제는 로봇 기업의 성패를 가르는 세계적 난제로 부상했다.
2024년 Pi0 모델이 활용한 1만 시간 규모의 실물 로봇 데이터, 2025년 Gen-0 모델이 사용한 27만 시간에 달하는 UMI(Universal Manipulation Interface:범용 조작 인터페이스) 데이터를 거쳐, 업계에서는 2026년 주요 알고리즘 기업들의 학습 데이터 규모가 반드시 ‘100만 시간’을 돌파할 것으로 전망하고 있다.
이처럼 데이터 수요가 급격히 확대되면서, 체화 지능 데이터 시장은 본격적인 폭발 국면에 진입할 것이며, 로봇 산업 전반에서는 데이터 수집·생성·활용을 둘러싼 새로운 경쟁 레이스가 시작될 것으로 예상된다.
이번 호에서는 중국 위챗 공식계정 ‘RoboSpeak(机器人大讲堂)’에 지난 1월 8일 게재된 내용을 바탕으로 재구성해 편집 게재한다.
◇왜 고품질 휴머노이드 데이터가 체화지능(Embodied Intelligence)의 ‘아킬레스건’인가?
챗GPT가 촉발한 AI 혁명 속에서 대규모언어모델(LLM)은 인터넷에 축적된 방대한 텍스트 데이터를 기반으로 ‘능력 발현(emergence)’을 이뤄냈다. 그러나 물리 세계에서 직접 움직이고, 만지고, 작업을 수행해야 하는 체화지능 로봇에 게 데이터 확보는 전혀 다른 차원의 과제다. 인터넷과 같은 기성 데이터 풀이 존재하지 않기 때문에, 모든 데이터는 실제 상호작용이나 시뮬레이션을 통해 일일이 맞춤형으로 생성해야 한다.
체화지능의 지속적 진화를 좌우하는 네 가지 핵심 요소는 알고리즘, 연산 능력, 로봇 하드웨어, 데이터다. 이 가운데 알고리즘과 컴퓨팅 파워, 하드 웨어는 빠르게 진화하고 있지만, 데이터만큼은 아직 돌파하지 못한 ‘세계적 난제’로 남아 있다. 체화 데이터는 단 순한 학습 재료를 넘어, 로봇지능의 상한선을 결정짓는 핵심 자산이라는 점에서 그 가치가 압도적이다.
데이터 수집의 최종 목적이 휴머노이드 로봇이 더 정교하고 안정적인 동작을 수행하도록 만드는 것, 즉 실제 적용 가능한 시나리오 구현에 있는 만큼, 최 근 체화 데이터 수집은 점차 휴머노이 드 형태의 데이터 수집 시스템을 우선 적으로 채택하는 방향으로 이동하고 있다. 휴머노이드는 구조와 동작 논리가 인간과 가장 유사해, 데이터의 현실성·범용성·일반화 가능성이라는 세 가지 핵심 요구를 동시에 충족할 수 있기 때 문이다. 이는 체화지능이 인간 환경에 적응하고 인간의 작업을 수행한다는 궁극적 목표와도 정확히 맞닿아 있다.
또한 현재 체화지능 산업 전반에는 휴머노이드 로봇이 미래의 주류 상용 화 형태가 될 것이라는 공감대가 형성 돼 있다. 이러한 흐름 속에서 휴머노이 드 로봇을 기반으로 구축된 데이터셋 은 산업 표준과 기술 발전 방향에 가장 잘 부합하며, 장기적인 데이터 가치 보 존 측면에서도 유리하다. 더 나아가 장 기적으로는 휴머노이드 로봇의 산업 화가 본격화될수록, 데이터 수집 → 모 델 고도화 → 제품 상용화 → 추가 데이 터 축적으로 이어지는 선순환 구조가 형성될 가능성이 크다. 이는 곧 데이터 가 곧 경쟁력이 되는 구조를 의미한다.
◇체화지능 슬롯사이트 수집 기업에는 어떤 곳들이 있을까?
(1)갤럭시아 AI(GALAXEA AI) 슬롯사이트 수집 시스템
갤럭시아 AI는 물리적 하드웨어부터 데이터 수집, 데이터 관리·라벨링·처리까지 아우르는 완전 폐쇄형 데이터 플랫폼(EDP, End-to-end Data Platform)을 구축했다. 이 플랫폼의 핵심 개념은 표준화된 로봇 본체를 활용해 실제 환경에서 작업을 수행하고, 그 과정에서 고품질·다중모달 데이터를 체계적으로 수집한 뒤, 완비된 툴체인을 통해 이를 관리·라벨링해 최종적으로 모델 학습과 반복 고도화에 활용하는 데 있다.
슬롯사이트 수집 시스템은 R1 라이트 범용 양팔 이동 조작 플랫폼과 R1 프로 고성능 휴머노이드 로봇을 표준 슬롯사이트 수집 본체로 활용한다. 이를 통해 복잡한 작업 환경에서의 슬롯사이트 수집과 검증이 가능하며, 슬롯사이트 포맷, 센서 모달 리티, 조작 스케일 측면에서 일관성을 확보함으로써 향후 대규모 슬롯사이트 처리와 활용을 위한 기반을 마련했다.
한편, 갤럭시아가 8월에 오픈소스로 공개한 오픈 월드 슬롯사이트셋(Galaxea Open-World Dataset) 역시 EDP 플랫폼을 기반으로 구축됐다. 해당 슬롯사이트셋은 공개 후 불과 두 달 만에 다운로드 수 40만 회를 기록하며, 전 세계 에서 가장 많이 활용되는 체화지능 실물 로봇 슬롯사이트셋 중 하나로 자리 잡았다. 이 슬롯사이트셋은 50개 이상의 실제 환경 시나리오를 포함하고 있으며, 총 누적 시간은 500시간, 슬롯사이트 규모는 10TB를 초과한다.
(2) 러쥐(Leju) 슬롯사이트 수집 시스템
러쥐의 휴머노이드 로봇 훈련장은 훈련 계층, 영속 저장 계층, 슬롯사이트 계층, 디바이스 계층의 네 가지 핵심 모듈로 구성된다. 훈련 계층에서는 GPU 연산 자원을 활용해 토치 쿠다(Torch CUDA) 기반의 고효율 계산을 수행한다.
데이터 수집 로봇 본체로는 쿠아보 (KUAVO) 4 프로 전신 휴머노이드 로봇과 쿠아보 LB 휠·암 결합형 휴머노이드 로봇 두 가지 이기종 플랫폼을 지원한다. 이들 로봇은 다양한 작업 시나리오를 포괄하며, 다수 로봇 간 협업 작업도 가능하도록 설계됐다. 또 한 집게형 그리퍼와 다지(多指) 로봇 핸드를 장착해 모방학습, 다중 과제 정책 학습 등 연구 요구를 충족한다.
러쥐의 데이터 수집 시스템은 데이터 생성-모델 학습-시뮬레이션 검증-실기 기 배포에 이르는 전 과정을 아우르는 툴체인을 제공하며, 데이터 툴킷과 예 제 코드도 함께 제공한다. 이를 통해 모 델의 작업 성공률과 환경 인식 범위를 동시에 높이고, 힘 제어 전략 최적화 및 촉각·시각 융합 모델 학습에 적합한 고 품질 데이터를 확보할 수 있다.
현재 러쥐는 중국에 6개의 대형 훈련장을 구축했으며, 연간 2000만 건 이상의 고품질 실기기 슬롯사이트를 생산하고 있다. 아울러 오픈아토믹재단과 협력해 OpenLET 커뮤니티를 조성, LET 슬롯사이트셋을 통해 6만 분 이상의 실기기 슬롯사이트와 800여 건의 정교 조작 슬롯사이트를 오픈소스로 공개했다.
(3) 루모스로보틱스(LUMOS Robotics) 슬롯사이트 수집 시스템
루모스로보틱스는 FastUMI Pro 다중모달 무(無)본체 슬롯사이트 수집 시스템을 통해 체화 지능의 대규모 확산을 가능하게 하는 핵심 인프라를 구축했다. 이 시스템은 정밀도, 적응성, 효율, 비용, 생태계 등 다섯 가지 측면에서 기존 방식 대비 우수한 성능을 보인다.
기존 원격조작 기반 데이터 수집과 달리, 루모스는 ‘모델 성공률에 책임지는 시스템 엔지니어링’이라는 새로운 패러다임을 제시했다. FastUMI Pro는 UMI 시나리오에 최적화된 고성능 센서를 통합해 60Hz 고주파 기록과 밀리초 단위의 멀티모달 동기화를 안정적으로 구현한다.
또한 루모스가 독자 개발한 8단계 산업용 슬롯사이트 품질 평가 체계를 통해 슬롯사이트 유효율을 기존 평균 70%에서 95% 이상으로 끌어올렸다. 슬롯사이트 1건 당 수집 시간은 50초에서 10초로 단축, 효율은 5배 향상됐으며, 종합 비용은 기존 방식의 5분의 1 수준으로 낮췄다.
특히 슬롯사이트 수집 시스템과 로봇 본체를 분리한 구조를 채택해, 수십 종의 로봇 암과 그리퍼에 신속히 적용 가능하며 슬롯사이트 사일로 문제를 해소했다. 루모스는 2026년까지 100만 시간 이상의 UMI 슬롯사이트 생산 능력을 구축할 계획이다.
지난 1월 7일, 루모스 로보틱스는 ‘루모스 FastUMI Pro 지능연구 가속 프로그램’을 공식 발표했다. 학술 분야에서는 논문 인센티브 제도를 도입해, 전 세계 연구자들이 FastUMI Pro 장비를 활용해 작성한 논문이 정식 게재될 경우 논문 한 편당 3만~5만위안(약 4000~7000달러)의 연구 장려금을 지급한다.
산업 분야에서는 ICRA WBCD 2026 양팔 로봇 챌린지 대회를 후원하며, 차세대 로봇 조작 및 슬롯사이트 표준 수 립 과정에 적극 참여하고 있다.
(4) 제리스 로보틱스(Zerith) 슬롯사이트 수집 시스템
체화지능 학습 과정에서 보편적으 로 제기돼 온 ‘데이터 모달리티 결손’ 문제를 해결하기 위해, 제리스 로보 틱스는 제리스(Zerith)-H1 설계 단계부터 다양한 모달리티 센서를 통합했다. 이를 통해 2차원 시각 정보, 3차원 공간 정보, 관절 상태 정보, 힘·촉각 피드백 정보 등 완전한(full) 모달 데이터 수집이 가능하도록 했다.
제리스의 전(全) 모달 데이터 아키텍처는 두 가지 핵심적인 장점을 갖는다. 첫째, 차원 호환성이다. 고차원의 전 모달 데이터는 필요에 따라 손쉽게 저 차원으로 축소할 수 있는데, 예를 들면 힘·촉각 데이터를 제거하면 순수 시각-관절 데이터셋을 생성할 수 있다. 이를 통해 기존 모든 주요 알고리즘 프레임워크의 학습 요구 사항에 무리 없이 대응할 수 있다. 둘째, 가치 지속성이다. 데이터 수집 단계에서 사전 처리 도구를 통해 다중모달 데이터 스트림을 정렬·정합함으로써, 현재 수집된 데이터가 향후 3~5년 내 등장할 차세대 체화지능 모델에도 지속적으로 활용 될 수 있도록 설계됐다. 이는 장기적인 알고리즘 진화를 뒷받침하는 ‘고차원 데이터 기반(Data Base)’ 역할을 한다.
한편, 제리스의 전 모달 슬롯사이트 수집용 휴머노이드 로봇 Zerith-H1은 이러한 전 모달 슬롯사이트 아키텍처를 전제로 설계돼, 전 모달 슬롯사이트의 실제 수집과 현장 적용을 완성도 높게 구현했다. Zerith-H1의 상지 구조와 자유도 설계는 인간의 신체 구조를 충실히 반영했으며, 여기에 관절 가동 범위를 대폭 확장해 성인 남성을 능가하는 작업 동작 범위를 확보했다. 모델 학습 과정에서는 제리스 로보틱 슬롯사이트 수집 센터가 AI 학습 도구 스완랩 (Swanlab)을 깊이 통합해, 모델 학습 전 과정에 대한 기록, 실시간 모니터링, 슬롯사이트 시각화, 대규모 실험 분석을 가능하게 했다. 이를 통해 사용자는 하이퍼파라미터를 보다 과학적으로 조정하고, 과거 실험 슬롯사이트를 체계 적으로 관리하며, 체화지능 모델을 효율적으로 반복 개선할 수 있다.
(5)다이몬로보틱스(DAIMON ROBOTICS) 힘·촉각 피드백 원격조작 데이터 수집 시스템
CES 2026에서 다이몬로보틱스는 세계 최초의 힘·촉각 피드백 기반 원격조작 데이터 수집 시스템 ‘디엠-엑 스톤2’를 공개했다. 다이몬 로보틱스는 체화지능을 위한 정교한 조작 인 프라 구축을 목표로, ‘3D 전략’을 중심으로 사업을 전개하고 있다. 이 전략은 △Device(시각·촉각 하드웨어 장비) △Data(다중모달 상호작용 데이터) △Deployment(시나리오 기반 현장 배치)를 의미하며, 감지에서 실행에 이르는 전 과정을 아우르는 완전한 기술 폐쇄루프를 구축하는 데 목적이 있다. 회사는 DaaS(Data as a Service)와 VTLA(Vision-Tactile-Language- Action) 모델을 기반으로 정교한 조작 기술의 대규모 제공을 추진하고 있다.
DM-EXton2의 핵심은 원격조작 과 정에서도 로봇이 ‘손의 감각’을 갖도록 하는 힘·촉각 피드백 기능이다. 이 시스템은 접촉력, 압착력 등의 정보를 실시간으로 조작자에게 전달해 깨지기 쉬운 물체의 파지, 정밀 삽입·결합 작업, 유연 물체의 그립 등 고난도·정밀 작업에서 힘의 한계를 보다 정확히 인지할 수 있도록 돕는다.
또한 로봇이나 조작자의 시야가 가 려지거나 시각 정보가 제한된 상황에서도, 조작자는 힘 피드백을 통해 물 체의 경도, 접촉 상태 등을 판단할 수 있어 보다 정확하고 안정적인 집기 및 배치 작업이 가능하다. 이러한 기능의 가치는 단순히 조작 경험과 성공률을 높이는 데 그치지 않는다. 더 나아가, 섬세한 힘 제어와 촉각 정보를 포 함한 고품질 다중모달 데이터를 로봇이 수집할 수 있도록 지원한다는 점에서 중요하다. 이 데이터는 로봇이 물체의 속성(부드러움, 단단함, 취성, 마찰 특성 등)과 상호작용 역학을 내재 적으로 이해하는, 이른바 ‘물리적 직관(Physical Intuition)’을 학습하는 데 핵심적인 학습 자산으로 활용된다.
(6)팍시니 테크(PaXini Tech) 슬롯사이트 수집 시스템
팍시니는 CES 2026에서 전(全) 모달(멀티모달) 체화지능 슬롯사이트 수집 시스 템을 중점적으로 공개했으며, 다차원 촉각 센서, 6축 힘 센서, DexH13 로봇 핸드, 토라-원(TORA-ONE) 및 토라-더블 원(TORA-DOUBLE ONE) 휴머노이드 로봇으로 구성된 풀스택 제품 포트 폴리오를 선보였다. 이번에 공개된 일 련의 성과는 핵심 감지 부품에서 완성형 로봇에 이르기까지의 물리적 도약을 실현했을 뿐 아니라, 하드웨어 실행 단말에서 고부가가치 슬롯사이트 자산으로 이어지는 기술적 확장 경로를 본격적으로 연결했다는 점에서 의미가 크다.
2025년 6월, 팍시니는 중국 톈진에 세계 최대 규모 수준의 체화지능 데이터 수집 및 모델 학습 기지인 ‘슈퍼 EID 팩토리’를 구축했다. 이 기지는 인 간 중심의 ‘휴먼 팩터’ 데이터 수집 패러다임을 기반으로, 전문화된 데이터 수집 인력 조직을 갖춘 것이 특징이다. 공장 작업, 가사 서비스 등 15+N 개의 핵심 응용 시나리오를 아우르며, 데이터 수집 인력은 고빈도 작업 시뮬레이션을 통해 다차원 촉각, 다시점 시각 정보, 자가 인지 정보, 공간 궤적 데이터를 포함한 전(全) 모달 데이터 를 정밀하게 확보한다.
글로벌 최고 수준의 체화지능 데이터 공장을 지향하는 이 시설에는 총 150개 의 표준화된 데이터 수집 유닛이 구축돼 있으며, 모든 유닛에는 자체 개발한 첨단 데이터 수집 장비와 시스템이 통합돼 있다. 이를 통해 데이터 획득의 고 정밀화는 물론 수집·처리 전 과정의 표준화를 실현했다. 이러한 혁신적인 데 이터 생산 체계를 바탕으로 슈퍼 EID 팩토리는 연간 약 2억 건에 달하는 고품질·전 모달·고가용성 데이터 생산 능력을 확보했으며, 이를 기반으로 억 단위 규모의 전 모달 데이터베이스 ‘옴니 셰어링 DB’를 구축하는 데 성공했다.
프로젝트 가동 이후 6개월 동안 해당 데이터 인프라는 전자 제조, 헬스케어·돌봄, 리테일 등 다양 산업 분야에서 로봇이 수행하는 수만 종의 정밀 작업을 지원해 왔다. 팍시니는 이 전 모달 데이터를 표준화된 데이터 교재 형태로 전 환해 글로벌 파트너들과 개방·공유함으로써, 체화지능 분야에서 오랫동안 지적돼 온 데이터 품질과 생산 효율이라는 이중 난제를 근본적으로 해소했다. 동시에, 견고한 억 단위 데이터 기반을 통해 전 세계 체화지능 산업의 범용화와 확산을 견인하는 핵심 동력을 제공하고 있다.
(7) 두봇(DOBOT) 슬롯사이트 수집 시스템
두봇의 슬롯사이트 수집 시스템은 아톰-엠 다형태 로봇 플랫폼을 기반으로 실제 산업 적용 슬롯사이트를 다시 제품 지능화로 환류시키는 강화 학습형 폐쇄 루프 구조를 형성한다. 몰입형 가상현실(VR) 슬롯사이트 수집 키트와 5G 초저지연 통신을 통해 마스터-슬레이브 로봇 간 지연을 10ms 이하로 제어하며, 동적 추적 알고리즘으로 진동과 오버슈트를 억제한다. 두봇의 엑스 트레이너 훈련 플랫폼은 획기적인 통합 시스템으로, 모방학습 신경망, 산업용 고정밀 로봇팔, 고성능 힘 피드백 마스터 핸드를 하나의 플랫폼으로 혁신적으로 결합했다. 이 시스템은 사람의 직관적인 원격 조작 시연을 통해 로봇이 기술을 학습하도록 함으로써, 로봇 스킬 학습에 있어 전례 없는 유연성과 정밀도를 제공한다. 이를 통해 신규 작업과 새로운 작업 시나리오에 대한 학습 기간을 기존 대비 약 70% 단축, 평균 약 2시간 수준으로 대폭 줄이는 성과를 거두었다.
엑스-트레이너의 핵심 가치는 효율 적이고 정밀하며 개방적인 연구 폐루 프(closed-loop)를 구축했다는 점에 있다. 먼저 ‘고효율 학습’ 메커니즘을 통해 모방학습 기반으로 로봇이 인간 의 복잡한 조작 기술을 빠르게 재현하고 습득할 수 있도록 한다. 이어 ‘정밀 조작’ 단계에서는 산업용 고정밀 로봇 팔과 포스 피드백 주(主)조작기를 기반으로, 시연부터 실제 실행에 이르기 까지 모든 동작이 완벽한 반복성과 정확성을 갖도록 보장한다. 나아가 초고속 배치 역량과 개방형 연구 특성을 바탕으로, 엑스-트레이너는 AI 대형 모델 데이터 수집, AGI(범용 인공지능) 시나리오 시뮬레이션 및 연구를 위한 이상적인 물리 세계 상호작용 플랫폼으로 자리매김하고 있다.
조규남 전문기자 ceo@irobotnews.com
