불안정한 네트워크 환경에서 강력한 성능 발휘

구글 딥마인드가 양팔 로봇용 온디바이스(On-device) 파운데이션 모델인  '제미나이 로보틱스 모델'을 공개했다.

제미나이 2.0의 다중 모드 추론 및 실제 세계 이해 능력을 '물리적 세계'로 확장하는 이 '비전-언어-액션(VLA)' 모델은 최소한의 컴퓨팅 자원으로 구동되며, 로컬 환경에서 최적화되어 지연 시간에 민감한 애플리케이션 및 불안정한 네트워크 환경에서 강력한 성능을 발휘할 것으로 기대된다.

딥마인드가 이번에 선보인 제미나이 로보틱스 온디바이스는 양팔 로봇을 위한 로봇 파운데이션 모델로, 기존의 대규모 클라우드 기반 AI 모델과 달리 최소한의 컴퓨팅 자원만으로 로컬에서 작동하도록 설계되었다. 이는 데이터 네트워크 연결 없이 독립적으로 구동될 수 있어, 지연 시간에 민감한 실시간 로봇 애플리케이션에 특히 유용하며, 연결이 불안정하거나 전혀 없는 환경에서도 안정적인 로봇 작동을 보장한다.

딥마인드는 온디바이스 모델의 주요 특징으로 △손재주 있는 조작을 통한 빠른 실험 용이성 △성능 향상을 위한 미세 조정을 통한 새로운 작업 적응 가능성 △낮은 지연 시간 추론으로 로컬 실행에 최적화된 점을 꼽았다.

딥마인드는 이 모델이 다양한 테스트 시나리오에서 강력한 시각적, 의미론적, 행동 일반화 능력을 보여주며, 자연어 명령을 따르고 가방 지퍼 풀기, 옷 접기 등 고도로 숙련된 작업까지 수행할 수 있다고 설명했다.

딥마인드는 온디바이스 모델과 함께 제미나이 로보틱스 소프트웨어 개발 키트(SDK)도 공개했다. 개발자들은 이 SDK를 활용하여 작업과 환경에 특화된 VLA 모델을 평가하고, 딥마인드의 무조코(MuJoCo) 물리 시뮬레이터에서 테스트할 수 있다. 또한, 최소 50~100회의 데모만으로 새로운 도메인에 빠르게 모델을 적용할 수 있어 개발 효율성을 극대화할 것으로 보인다. SDK는 딥마인드의 '신뢰할 수 있는 테스터 프로그램'을 통해 접근 가능하다.

딥마인드는 제미나이 로보틱스 모델이 프랑카 로보틱스의 양팔 로봇인 'FR3' 로봇에서 일반적인 명령을 따라 이전에 보지 못했던 물체나 장면을 처리하고, 옷 접기와 같은 정교한 작업, 산업용 벨트 조립 등 정밀성이 요구되는 작업을 성공적으로 수행했다고 밝혔다.

나아가 아폴로 휴머노이드와 같은 상이한 로봇 플랫폼에서도 동일한 범용 모델이 자연어 명령을 따르고 다양한 물체를 조작할 수 있음을 입증하며 모델의 범용성을 강조했다.

딥마인드는 모든 제미나이 로보틱스 모델이 AI 원칙에 따라 개발되며, 의미론적 안전과 물리적 안전을 포함하는 총체적인 안전 접근 방식을 적용하고 있다고 밝혔다. 라이브 API를 통한 의미론적 및 콘텐츠 안전 확보, 낮은 수준의 안전 제어기와 모델 인터페이스, 그리고 최근 개발된 시맨틱 안전성 벤치마크를 통한 시스템 평가 및 레드팀 연습을 통한 취약점 노출을 권장하는 등 다각적인 노력을 기울이고 있다.

딥마인드의 '책임 있는 개발 및 혁신(ReDI)' 팀은 모든 제미나이 로보틱스 모델의 실제 영향을 지속적으로 분석하며, '책임및안전위원회(RSC)'는 이를 검토하여 안전성과 효용성을 극대화하는 방안을 모색한다.

딥마인드는 현재 제미나이 로보틱스 온디바이스를 신뢰할 수 있는 테스터 그룹에 우선 공개하여 사용 및 안전 프로필에 대한 이해를 높이고 피드백을 수집하고 있다고 밝혔다.

저작권자 © 로봇신문 무단전재 및 재배포 금지