코가로보틱스 서일홍 대표

코가로보틱스 서일홍 대표
▲코가로보틱스 서일홍 대표

“지능이란 놀라지 않기 위한 능력이다.” 예측 가능한 세계에 살기를 원한다. 아침에 눈을 뜨면 태양이 동쪽에서 떠 있고, 부엌의 커피 머신은 어김없이 작동하며, 엘리베이터는 버튼을 누르면 내려온다. 그러나 가끔 세상은 우리를 놀라게 한다. 평소와 다른 냄비의 울림, 예고 없이 울리는 알람, 생각지 못한 사람의 말 한마디. 이런 ‘놀람’은 뇌에게 일종의 경고음이며, 우리는 놀라는 순간부터 세상을 다시 보기 시작한다.놀람의 법칙(Free Energy Principle =FEP)은 이런 일상의 본능적 반응을 과학적으로 설명하는 신경과학 이론이다. 간단히 말하면, 뇌는 외부 세계를 예측하고, 그 예측이 빗나갔을 때 놀란다. 그리고 놀라지 않기 위해 뇌는 스스로를 조정하고, 세상을 더 정확히 예측하려 애쓴다. 또한 열이 나면 약을 먹거나 병원에 가는 것처럼 , 놀람을 능동적으로 줄이기 위한 행동을 유발 시킨다. 뇌는 일종의 예측 기관이며, ‘놀람’은 학습을 촉진하는 생물학적 신호인 셈이다.

오랜 기간 동안, 로봇이 사람처럼 생각하고 행동하고, 사람처럼 배우는 존재가 될 수 있는가를 많은 사람들이 궁금해왔다. 지금까지의 인공지능은 많은 발전을 이루었지만, 여전히 세상에 ‘놀랄 줄 모르는’ 기계에 머물러 있는 것 같다.

놀람의 법칙을 지키기위해서 필요한 능력은 크게 3가지이다. 세상을 잘 인식 해야 하고, 세상이 어떤 물리적 규칙으로 변하는 것을 알아야 하고, 놀람을 줄이도록 하는 다양한 행동을 배우고 준비 해야 한다. 이러한 3가지 능력을 동시에 학습하여 갖출 수 있게 한 것이 대규모 언어 모델(LLM) 이며, LLM은 어마어마한 데이터를 학습하여, 인식, 물리 규칙의 이해 및 정교한 응답을 할 수 있다. 그리고 제법 실 세계에서 지시에 부합하는 작업을 잘 수행 한다. 그러나, 그것은 어디까지나 ‘과거의 패턴’에 기반한 반응이다. 정적인 입력과 출력, 즉 수동적 지식의 복사이다. ( 최근 TTT ( test time training ) 이라는 실시간 적응 학습을 LLM 에 시도 하고 있다. )

반면, 사람은 다르다. 사람은 모르는 것에 직면하면 먼저 놀라고, 그 놀람을 줄이기 위해 사고하고, 환경을 바꾸거나 자신을 변화시킨다. 예측은 단지 정보 처리가 아니라, 생존을 위한 행동의 기반이다. 그렇다면 기계도 이처럼 예측하고 놀라며, 놀라지 않기 위해 스스로를 조정할 수 있을까?

이 질문에 대한 실마리를 풀기 위해서, 놀람의 법칙 (FEP)에 기반한 섀도 어 슬롯 강화 파운데이션 모델(Robot Foundation Model, RFM)을 생각해 볼 수 있다. RFM은 단순히 데이터를 받아들이는 AI가 아니라, 현실 세계에서 몸을 갖고 감각하고, 움직이며 학습하는 체화 지능(embodied intelligence)를 위한 프레임워크이다. 현재 RFM은 주로 여러가지의 센서 데이터를 통해 섀도 어 슬롯 강화이 다양한 작업을 수행하도록 학습시키는 구조 이다. 그러나 이 모델이 사람과 같은 지능이 되려면, 단순히 반응하는 것이 아니라 자기만의 세계모델을 구축하고, 그 예측이 빗나가는 것을 감지하며, 스스로 그 오류를 줄이기 위해 모델을 조정하거나 실시간으로 행동을 고도화 하도록 스스로 배우는 능력이 필요하다.

FEP 기반의 RFM은 뇌처럼 ‘세계에 대한 예측 모델’을 내부에 갖추도록 해야 한다. 예를 들어, 로봇이 문을 열려는 순간, 손잡이의 위치가 예상과 다르면 ‘예측 오류’가 발생한다. 이 오류는 단지 실패로 끝나지 않는다. 오히려 그것은 새로운 학습의 시작점이 된다. 로봇은 오류를 줄이기 위해 손의 위치를 수정하거나, 인식 모델을 수정 하거나 하여, 다음에는 다른 전략을 사용할 준비를 한다. 이처럼 예측 오류를 감지하고 모델을 수정 하는 구조는, 인간의 유아기에서 볼 수 있듯이, 지능이 발달하는 근본 구조이다. 이것은 단순한 알고리즘의 전환이 아니라, 사고방식의 전환이다. ( 최근 메타에서 제시한 JEPA 라는 AI 모델이 예측 오류 기반의 학습 구조로 생각 할 수 있다. )

현재 AI는 주어진 문제에 최적의 답을 찾으려는 반면, FEP 기반 AI는 세상과 끊임없이 상호작용하면서 스스로 문제를 정의하고, 세상을 이해하려 한다. 말하자면, 현재 AI가 시험 문제를 잘 푸는 모범생이라면, FEP 기반 AI는 자기만의 질문을 던지고 해답을 찾는 탐구자에 가깝다.

놀라운 세상 속에서 덜 놀라는 법을 배우는 존재, 바로 뇌처럼 생각하는 섀도 어 슬롯 강화 이다. 이러한 방향은 단지 기술의 진보가 아니라, 지능 그 자체에 대한 이해를 확장하는 여정이다. 우리가 놀람을 줄이기 위해 뇌를 썼듯, 이제 기계도 뇌를 닮아가는 법을 배울 것이다.

저작권자 © 로봇신문 무단전재 및 재배포 금지