문병성의 무료 슬롯 카지노 역사 이야기(94)

2024년 6월 아마존이 인수한 AI 로봇 스타트업 코베리언트(Covariant)는 물류 창고 작업을 하는 로봇 팔에 초점을 두고 있었지만, 로봇 파운데이션 모델(Foundation Model)을 구축하고 있었다. 원래 오픈AI의 초창기 로봇 과학자 세 명이 분사해 설립한 회사였다. 공동 창업자 중 한명인 피터 아빌(Pieter Abbeel)은 버클리대에서 로봇학습연구소를 설립하고, 버클리 인공지능연구소를 운영하기도 했다. 그는 2019년에 토론토 대학의 창조적파괴연구소(Creative Destruction Lab)에서 있었던 컨퍼런스에서 ‘물리 세계를 위한 AI를 향해(towards AI for the Physical World)’라는 제목으로 연설을 했다.

연설에서 그는 딥러닝과 강화 학습 같은 AI 발전을 통해 무료 슬롯 카지노공학의 연구는 놀라운 발전을 해왔지만, 연구 결과는 실제 물리 세계에서 가치를 창출하는 데 필요한 높은 신뢰성을 달성하지 못하고 있다고 주장했다. 그것은 AI가 가상 환경이나 디지털 세계에서는 인간을 뛰어넘는 성능을 보여주었지만, 무료 슬롯 카지노이 실제 물건을 집거나 조립해야 하는 물리적 세계에 적용해 보면 그 성능은 현저히 떨어진다는 것이었다. 그래서 AI는 디지털 세계의 성공에 안주하지 말고, 복잡하고 예측 불가능한 현실 세계의 문제를 해결하는 방향으로 나아가야 한다고 주장했다.

이 연설은 현재처럼 ‘피지컬 AI(Physical AI)’라는 용어가 광범위하게 확산되고 쓰이기 전에, 그 개념의 필요성과 핵심 과제를 제시한 선구적인 내용이었다. 이전에도 ‘체화 지능(Embodied AI)’과 같은 유사한 학술적 용어는 존재했지만, 피지컬 AI는 파운데이션 모델의 발전과 맞물려 상업적, 대중적 파급력을 가진 용어로 자리 잡아 나갔다. 특히 2024년 초에 오픈 AI의 협력으로 시연된 피규어 01의 충격적인 시연은 피지컬 AI의 가능성을 각인시켜 주었고, CES 2025에서 젠슨 황의 키노트 연설은 피지컬 AI를 로봇 연구의 거대한 담론으로 만들어 버렸다. 그래서 현재의 로봇, 특히 휴머노이드 연구는 AI를 배제하고는 생각할 수 없는 분야가 되었다.

지난 회에서는 지능형 로봇이라는 용어를 살펴보면서 산업용 로봇의 지능화 발전 과정과 산업용 로봇에 AI를 적용하려는 노력과 연구를 살펴보았다. 하지만, 최근 AI와 연관 지을 때, 가장 관심을 받는 로봇은 단연 휴머노이드이다. 최근에 공개되는 휴머노이드와 그 기술은, 과거에는 상상하기 어려웠을 정도로 진보된 모습을 보여주며 사람들을 놀라게 해주고 있는데, 그 진화의 저변에는 AI 기술이 자리하고 있다. 이런 휴머노이드의 기술 혁신은 AI 모델과 로봇 제어기술의 융합에서 나오고 있으며, 그 과정에서 ‘피지컬 AI’, ‘파운데이션 모델’, ‘VLA’, ‘종단간 모델’, ‘강화학습’과 같은 AI 기술 용어들이 난무하며, 로봇 기술 발전의 이해에 복잡성을 더해주고 있다. 이번 회에서는 과거의 휴머노이드들의 지능화와 한계 그리고 최근 휴머노이드의 발전 사례와 함께 AI 기술 용어에 대해 살펴본다.          

2000년대 이후에 등장한 휴머노이드들은 지능형 로봇이라 불렸는데, 혼다의 아시모의 경우 단순한 프로그래밍된 동작의 재생을 넘어, 주변 환경을 인식하고 제한된 범위 내에서 자율적으로 판단하여 행동하는 능력을 보여 줬다. 예를 들어 넘어질 위험이 감지되면 인간의 개입 없이 즉각적으로 다리를 뻗어 균형을 유지하고, 주변 사람들의 움직임을 파악하고 상황 변화를 예측하며 대체 경로를 생성하는 등 다음 행동을 스스로 결정할 수 있었다. 또한 여러 사람이 동시에 말하는 상황에서도 각각의 음성을 구별해 인식하는 등, 인간에게도 어려운 과제를 수행하는 능력을 보여주었다. 

초기 모델은 프로그램된 궤적의 보행만을 했던 카이스트의 휴보 역시, 점차 실시간 보행 제어 알고리즘을 적용하고 센서로 인식한 환경을 바탕으로 스스로 판단과 제어를 하며 지능형 무료 슬롯 카지노의 모습을 갖춰 갔다. 특히 음성, 얼굴 제스처 인식 기능을 지원하고 대화형 인터페이스를 일부 제공했으며, 알버트 휴보는 인간과의 감성적 상호작용에 초점을 맞추어 인간의 표정을 이해하고 모방하는 능력을 선보였다. 그런데, 사전에 프로그래밍된 논리와 명시적인 세계 모델에 의존한 당시의 무료 슬롯 카지노들은 예측 가능한 환경에서는 어느 정도 인상적인 성능을 보였 줬지만, 실제 세계의 무한한 변동성에 대응하기는 현실적으로 불가능했다. 이런 한계는 무료 슬롯 카지노이 스스로 데이터를 통해 학습하는 패러다임으로의 전환이 필연적이었음을 보여 주었고, 무료 슬롯 카지노공학 분야에서 AI 혁명이 시작된 근본적인 배경이다.

2012년의 이미지 인식 대회인 ILSVRC에서의 알렉스넷이 압도적인 차이로 우승하면서 딥러닝은 AI 연구 흐름을 크게 바꿔 놓았는데, 로봇에게도 탁월한 인식 능력을 갖게 해주는 눈이 되어 주었다. 특히 2015년 딥마인드(DeepMind)가 신경망을 이용해 스스로 학습해서 비디오 게임을 플레이하고 목표를 달성하도록 훈련할 수 있는 DQN 알고리즘을 공개하면서, 강화학습에 대한 관심이 크게 증가했다. 

이에, 많은 연구기관에서는 비전 딥러닝과 강화 학습을 적용해 무료 슬롯 카지노이 작업을 스스로 수행하는 방법을 학습하게 하는 연구가 활발해졌다. 예를 들어, 버클리대학에서는 무료 슬롯 카지노의 주행을 스스로 학습하도록 했고, 브렛(Brett)이라는 무료 슬롯 카지노은 목표만 주어진 채 구멍에 맞는 부품을 끼워 넣는 작업을 강화학습을 통해 스스로 학습했다. 구글도 물건 집기나 문을 여는 등 다양한 작업을 무료 슬롯 카지노 스스로 학습하도록 강화학습을 적용한 연구를 했는데, 2019년에는 어떤 물건이든 집어서 1~2미터 떨어진 정해진 상자에 부드럽게 던져 넣는 토싱봇(TossingBot)을 개발했다. 같은 해 오픈AI가 공개한 루빅스 큐브를 맞추는 무료 슬롯 카지노 손은 마찰력과 같은 실제 세계의 변동성과 불확실성을 구현한 가상현실에서 딥러닝을 통해 스스로 학습을 한 뒤 실물로 구현한 사례였다. 이런 사례들은 이전 세대의 지능형 무료 슬롯 카지노에 비해 확실히 진보된 실험 결과들을 보여 주었지만, 아빌의 주장과 같이 물리적 현실 세계에 적용하기에는 성능이 만족스럽지 못했다.

2020년대에 이르러 휴머노이드를 비롯한 무료 슬롯 카지노공학에서 AI 혁신이 주목을 다시 받게 된 배경에는 대규모 언어 모델(LLM)과 시각-언어 모델(VLM)과 같은 파운데이션 모델이 있다. AI 연구에서 생성된 용어인 파운데이션 모델은 대규모 데이터를 활용해 학습된 범용 AI 모델을 뜻한다. 인터넷 규모의 방대한 텍스트와 이미지 데이터로 사전 훈련되어 광범위한 작업에 응용이 가능한 이 모델들은 이전의 AI 시스템에서는 찾아볼 수 없었던 수준의 상식에 가까운 추론 능력과 문맥 이해 능력을 갖추게 되었다. 무료 슬롯 카지노공학 분야도 이런 파운데이션 모델의 성공에서 영감을 받아, 특정 작업이 아닌 여러 작업에 적용 가능한 일반화된 프레임워크로서 무료 슬롯 카지노의 뇌로 활용하려는 연구를 했는데, 또 이는 과거의 무료 슬롯 카지노이 수행할 수 없었던 고차원적인 작업 계획도 가능하게 해주었다.

한편, 피규어 AI는 초기 전략으로 오픈AI와의 협력을 통해 VLM을 로봇에 통합하는 방식을 선택했고, 대표적으로 2024년 1월 커피를 만드는 로봇의 시연 동영상을 공개했다. 그러나 얼마 지나지 않아, 오픈AI와의 협력 종료를 선언하고, 독자적인 AI 개발 노선을 걷겠다고 하며 헬릭스(Helix)를 개발하기 시작했는데, 이는 VLA(Vision-Language-Action) 모델이었다. 주변 환경을 보고, 사람의 말을 듣고 이해하기 위한 VLM에, 휴머노이드가 적절한 행동을 취할 수 있도록 행동을 추가해서 이미지와 언어에 따른 동작까지 직접 학습하는 것이 VLA 모델의 개념이다. 예를 들어 2023년에 구글이 공개하며 VLA의 개념을 확립한 RT-2(Robot Transformer 2)는 인터넷에서 수집한 이미지와 텍스트를 학습해 로봇 행동으로 전이시키는 시연을 보였다. 그 외에도 2024년에 공개된 오픈VLA(OpenVLA), 파이제로(π0), 2025년에 공개된 피겨사의 헬릭스(Helix), 엔비디아의 그루트 N1(GROOT N1), 구글의 제미나이 로보틱스 등이 대표적인 VLA 모델이다.

또, 2023년 9월에 테슬라는 옵티머스가 물건을 정리하고 요가 동작을 하는 동영상과 함께, 옵티머스가 완전히 종단간 방식으로 훈련되었다고 트윗했는데, 지난 8월에는 보스턴 다이나믹스의 아틀라스가 부품 정리를 하는 동영상을 공개하면서 종단간 신경망으로 학습했다고 설명했다. 전통적인 무료 슬롯 카지노의 제어는 인식과 상태추정, 계획, 제어의 단계를 나눠서 수행했다. 그런데, 최근에는 센서 입력부터 제어 명령까지 단일 신경망으로 수많은 데이터와 강화학습을 통해 직접 학습하는 모델이 부상하고 있으며, 이를 종단간 모델(End-to-End Model)이라고 한다. 이는 인식에서 행동까지의 전체 과정을 중간 단계 없이 하나의 통합된 모델로 직접 학습하는 방식으로, 사람이 공을 잡을 때 공의 궤도를 복잡하게 계산하는 대신, 보는 즉시 본능적으로 손을 뻗는 것과 같이 무료 슬롯 카지노을 만들려는 접근 방식이다. 종단간 모델은 복잡한 상황에서도 빠르게 반응 가능하며, 다양한 작업을 하나의 모델로 통합 가능하고 새로운 환경에서 학습 가능하다는 장점이 있지만, 아직 안정성이나 안전성 문제로 연구가 더 필요한 과제이다.

휴머노이드에게 가장 어려운 과제 중 하나는 동적 균형 유지와 민첩한 움직임이다. 이를 해결하기 위해서 강화학습과 ‘Sim2Real’이라는 시뮬레이션 기법도 많이 사용된다. 강화 학습은 물리학적으로 완벽하게 모델링하기 어려운 보행과 같은, 복잡하고 동적인 작업을 학습하는 데 특히 효과적이다. 또, 수천 개의 시뮬레이션을 병렬로 실행함으로써 로봇은 단 몇 시간 만에 수년간의 보행 연습을 경험하고, 강건한 보행 정책을 학습할 수 있다. 오픈AI의 루빅스 큐브 로봇 손을 비롯해서 최근의 피겨사의 헬릭스까지 많은 휴머노이드가 시뮬레이터를 활용해 학습을 가속화하고, 이렇게 생성된 데이터는 실제 로봇 제어 모델을 훈련하는 데 사용되고 있다. AI에서 파운데이션 모델의 데이터인 텍스트와 이미지와 달리 로봇 훈련에 필요한 데이터는 충분하지 않은데, 실제 환경에서 이를 수집하는 것은 비용과 시간이 많이 들기 때문에 현실적으로 쉽지 않은 문제이다. 그래서 옵티머스의 사례와 같이 로봇 동작이나 제어 데이터를 모방학습(Learning from Demonstration, Imitation Learning)으로 생성하기도 하지만, 대규모 합성 데이터를 활용하기도 한다. 이 과정에서 생성형 AI는 다양한 시나리오의 합성 데이터를 대량으로 생성하여 데이터 부족 문제를 해결하는 데 큰 도움을 주고 있다.

이렇듯 최근의 휴머노이드 연구에는 다양한 그리고 최신의 AI 기술들이 모두 활용되고 있다. 이러한 활용 방식은 디지털 정보 처리라는 기존 AI의 근본 목표가, 물리적 세계에서의 의미 있고 적응적인 행동 수행으로 전환되는 패러다임의 변화 양상을 보여주고 있다. 이렇게 AI가 이미지나 텍스트 같은 디지털 정보의 처리 수준을 넘어서, 센서나 액추에이터 같은 물리적 기기를 이용해 물리 세계와 상호 작용하는 방식으로 통합되는 피지컬 AI는 과거에도 ‘체화 지능(Embodied AI)”이라는 용어로 개념이 존재했었다. 그런데, 엔비디아를 중심으로 한 상업적 참여자들이 로봇공학에 활용되는 다양한 AI 기술의 스택을 확립하려는 노력의 일환으로 용어를 전략적으로 재구성하며, 피지컬 AI는 폭발적인 관심을 받고 대중화되어 왔다고 볼 수 있다. 하지만, 용어의 의미나 대중화 과정과 관계없이, 새로운 AI 기술 기반의 로봇들은 물리적 세계에서의 산업과 일상 생활의 패러다임을 근본적으로 바꿀 잠재력을 가지고 있는 것은 확실히 보인다.

  <필자:문병성 moonux@gmail.com>

필자인 문병성은 금성산전, 한국휴렛패커드, 애질런트 테크놀로지스, 에어로플렉스 등 자동화업계와 통신업계에 30년 이상 종사했으며, 최근에는 로봇과 인공지능 등 신기술의 역사와 흐름에 관심을 갖고 관련 글을 매체에 기고하고 있다.


 

 

저작권자 © 로봇신문 무단전재 및 재배포 금지