제6장. 예측이 몸을 가질 때 — Physical AI와 체화된 인지 · 키비타스 아겐티아 1권

*이 장을 다 읽고 나면 알게 될 것: AI가 물리적 세계에 나왔을 때 무엇이 근본적으로 달라지는지, 그리고 체화된 인지가 왜 의식 논쟁의 판을 바꾸는지*

도입: 로봇이 넘어질 때

2024년 CES에서 유니트리의 휴머노이드 로봇 H1이 무대에서 넘어졌다. 관중이 웃었다. 그런데 H1은 스스로 일어났다. 팔을 짚고, 무릎을 세우고, 일어섰다. 관중의 웃음이 박수로 바뀌었다.

이 장면이 왜 의미 있는가. 넘어지고 일어서는 것은 인간에게는 당연하다. 두 살짜리 아이도 한다. 그러나 로봇에게는 아직도 어렵다. 왜냐하면 넘어지는 것은 물리적 세계의 복잡성과 직면하는 것이기 때문이다. 중력, 관성, 마찰, 지면의 불규칙함. 이 모든 것을 실시간으로 처리해야 한다.

화면 속의 AI는 이런 문제가 없다. 텍스트를 만들고, 이미지를 생성하고, 코드를 짠다. 실수해도 물리적 결과가 없다. 잘못된 문장을 쓰면 지우면 된다. 그러나 로봇이 실수하면 물건이 깨진다. 사람이 다칠 수 있다. 로봇 자체가 고장 난다.

AI가 몸을 가진다는 것은, 예측이 물리적 결과를 가진다는 것이다.

이것이 Physical AI의 핵심이고, 이 장의 출발점이다.

6.1 디지털 AI와 Physical AI

구분을 명확히 하자.

디지털 AI는 화면 안에 산다. ChatGPT, 클로드, 미드저니, 코파일럿. 이것들은 정보를 입력받고 정보를 출력한다. 물리적 세계와 직접 상호작용하지 않는다. 실수해도 물리적 피해가 없다. 수정이 즉시 가능하다.

Physical AI는 물리적 세계에 산다. 로봇, 자율주행차, 드론, 산업용 매니퓰레이터. 이것들은 센서로 물리적 세계를 인식하고, 액추에이터로 물리적 세계에 개입한다. 실수하면 물리적 결과가 따른다. 수정이 즉시 불가능하다.

이 차이는 근본적이다.

디지털 AI의 실수는 불편하다. "잘못된 정보를 줬네." 다시 물으면 된다. Physical AI의 실수는 위험하다. 자율주행차가 보행자를 인식하지 못하면 사람이 죽는다. 수술 로봇이 잘못된 위치를 절개하면 환자가 다친다. 물류 로봇이 물건을 떨어뜨리면 수억 원의 손실이 발생한다.

그래서 Physical AI는 디지털 AI보다 훨씬 높은 기준을 만족해야 한다. 99퍼센트의 정확도는 디지털 AI에서는 훌륭하다. Physical AI에서는 부족하다. 1퍼센트의 오류가 생사를 가를 수 있기 때문이다.

잠시 멈추고 생각해보자
디지털 AI의 실수와 Physical AI의 실수는 본질적으로 다른가? 디지털 AI의 잘못된 의료 조언이 환자의 행동을 바꾼다면, 그것도 "물리적 결과"가 있는 것이 아닌가? 경계는 어디인가?

6.2 체화된 인지 — 몸이 생각을 만든다

여기서 흥미로운 철학적 전환이 일어난다.

전통적인 인지과학은 마음을 컴퓨터에 비유했다. 입력(감각) → 처리(사고) → 출력(행동). 뇌가 모든 것을 처리하고, 몸은 그저 뇌의 명령을 수행하는 기계다. 이 관점에서 보면 AI에게 몸은 필요 없다. 뇌(컴퓨터)만 있으면 된다.

그런데 1990년대부터 다른 관점이 등장했다. 체화된 인지. 영어로 embodied cognition. 핵심 주장은 이것이다. 사고는 뇌에서만 일어나지 않는다. 몸 전체에서 일어난다.

예를 들어보자. "무겁다"라는 개념을 생각해보자. 이 개념은 추상적 기호가 아니다. 무거운 것을 들어본 경험에서 나온다. 근육의 긴장, 관절의 압력, 호흡의 변화. 이 모든 신체적 경험이 "무겁다"라는 개념의 기초다. 무거운 것을 들어본 적이 없는 존재에게 "무겁다"는 완전히 다른 의미를 가질 것이다. 아니, 의미를 가질 수 있는지조차 불확실하다.

조지 레이코프와 마크 존슨은 이것을 인간 언어의 은유 구조에서 발견했다. "무거운 책임", "가벼운 마음", "따뜻한 사람", "차가운 태도". 인간의 추상적 사고는 신체적 경험의 은유에 기반한다. 몸이 없으면 이 은유의 기반이 없다.

이 관점에서 보면, 현재의 LLM이 "따뜻한 사람"이라는 표현을 쓸 때, 그것은 진짜로 따뜻함을 이해한 것이 아니다. "따뜻한"이라는 단어가 "사람" 앞에 오는 패턴을 학습한 것이다. 체온의 느낌, 햇볕의 감각, 포옹의 온기. 그런 경험 없이 "따뜻한"은 그저 기호일 뿐이다.

6.3 Physical AI는 체화된 인지를 가질 수 있는가

여기서 핵심 질문이 등장한다. 로봇이 몸을 갖고 물리적 세계와 상호작용하면, 체화된 인지가 생길 수 있는가?

낙관론자들은 그렇다고 말한다. 로봇이 물건을 잡고, 넘어지고, 부딪히면서 물리적 세계에 대한 "이해"를 발전시킬 수 있다고. 시뮬레이션이 아닌 실제 물리적 경험을 통해.

비관론자들은 아니라고 말한다. 로봇의 센서가 받는 데이터는 여전히 숫자일 뿐이라고. 인간의 감각과는 질적으로 다르다고. 압력 센서가 느끼는 것과 인간의 손이 느끼는 것은 같은 것이 아니라고.

나는 이 논쟁에서 중간 지점에 선다. Physical AI가 체화된 인지를 완전히 재현할 수 있을지는 모르겠다. 그러나 Physical AI가 디지털 AI보다 세계에 대해 더 "풍부한" 표상을 만들 수 있다는 것은 분명하다.

왜냐하면 물리적 세계와 상호작용하면 피드백이 즉각적이고 풍부하기 때문이다. 텍스트에서 학습하는 것과 물리적 세계에서 학습하는 것의 차이는 크다. 책으로 수영을 배우는 것과 물에 들어가서 배우는 것의 차이와 같다.

엔비디아의 젠슨 황은 이것을 알고 있다. 그래서 엔비디아는 Physical AI에 대규모 투자를 하고 있다. Omniverse라는 물리 시뮬레이션 플랫폼, Isaac라는 로보틱스 프레임워크, Cosmos라는 월드 모델. 모두 AI에게 물리적 세계를 "경험"시키기 위한 도구다.

잠시 멈추고 생각해보자
로봇이 수천 번 넘어지고 일어서는 경험을 한다면, 그것은 인간 아이가 걸음마를 배우는 것과 같은 종류의 경험인가? 다른 종류인가? 차이가 있다면 그것은 무엇인가?

6.4 Sim-to-Real — 왜 시뮬레이션 ≠ 현실인가

시뮬레이션의 한계를 구체적으로 보자. 이것이 Physical AI의 가장 어려운 문제다.

시뮬레이션에서 로봇은 완벽하게 작동한다. 가상 세계의 물리 법칙은 깨끗하다. 바닥은 균일하고, 빛은 일정하고, 물체의 무게는 정확히 계산된다. 그런데 현실은 지저분하다. 바닥에 물이 묻어 있다. 조명이 갑자기 바뀐다. 물체의 표면이 미끄럽다. 예상하지 못한 장애물이 있다.

테슬라 옵티머스 팀은 이 간극에 대해 흥미로운 고백을 했다. 시뮬레이션에서 95% 성공률을 보이던 물건 잡기 동작이 실제 공장에서는 60%로 떨어졌다고. 나머지 35%는 시뮬레이션에 없던 변수들 때문이었다. 물체의 미세한 변형, 센서의 노이즈, 주변 로봇의 진동.

이 간극을 Sim-to-Real gap이라 부른다. 그리고 이 간극을 메우는 것이 Physical AI에서 가장 비싼 작업이다. 시뮬레이션 1만 시간은 쉽다. GPU를 돌리면 된다. 그러나 현실에서의 1시간은 어렵다. 로봇이 부서질 수 있다. 사람이 다칠 수 있다. 시간이 실제로 흐른다.

그래서 현재의 Physical AI는 두 가지 전략을 병행한다. 시뮬레이션에서 대량의 기초 학습을 하고, 현실에서 소량의 미세 조정을 한다. 이것을 sim-to-real transfer라 부른다. 완벽하지는 않다. 그러나 현실적으로 가능한 최선이다.

6.5 로봇의 현재 — Figure 02, Optimus Gen 3, Unitree G1, 현대로보틱스

2026년 기준, 가장 주목할 만한 Physical AI 프로젝트 네 가지를 보자.

Figure 02. 미국 Figure AI가 만든 범용 휴머노이드다. BMW 스파르탄버그 공장 조립 라인에 실제 배치되었다. 시연이 아니다. 생산 공정에 투입된 것이다. OpenAI의 모델과 연결되어 자연어로 지시를 받고 작업을 수행한다.

Tesla Optimus Gen 3. 테슬라 프리몬트 공장에서 배터리 셀을 분류한다. 22개 관절의 손가락이 개별적으로 움직인다. 일론 머스크는 옵티머스가 테슬라의 가장 큰 사업이 될 것이라고 말한다. 2026년 기준 가격은 공개되지 않았지만, 장기적으로 2만 달러 수준을 목표로 한다고 밝혔다.

Unitree G1. 중국 유니트리의 휴머노이드는 가격으로 승부한다. 약 1만 6천 달러. 자동차 한 대 값이다. 성능은 Figure나 Optimus에 못 미치지만, 가격이 시장을 여는 열쇠가 될 수 있다. 중국의 전략은 항상 그랬다. 먼저 싸게 만들고, 그 다음에 품질을 올린다.

현대로보틱스 + 보스턴 다이내믹스. 현대가 인수한 보스턴 다이내믹스의 아틀라스는 세계 최고의 이동 능력을 가진 로봇이다. 이제 과제는 이 하드웨어에 AI "두뇌"를 심는 것이다. 물류 창고에서의 실용화가 진행 중이다.

이 네 프로젝트의 공통점이 있다. 모두 "시연"에서 "실전"으로 넘어가고 있다는 것이다. 2024년까지는 "로봇이 커피를 나른다"는 영상이 뉴스가 됐다. 2026년에는 "로봇이 공장 라인에서 일한다"가 뉴스가 된다. 이 차이는 크다.

잠시 멈추고 생각해보자
Unitree G1이 자동차 한 대 값이라면, 5년 후에는 스마트폰 값이 될 수도 있다. 모든 가정에 휴머노이드가 있는 세상에서, 인간의 "몸으로 하는 일"의 가치는 어떻게 바뀔 것인가?

6.6 월드 모델 — AI의 물리 법칙

Physical AI가 물리적 세계에서 작동하려면, 물리적 세계에 대한 내부 모델이 필요하다. 이것을 월드 모델이라고 부른다.

인간에게도 월드 모델이 있다. 공을 던지면 포물선을 그리며 날아간다는 것을 안다. 물이 높은 곳에서 낮은 곳으로 흐른다는 것을 안다. 무거운 것이 떨어지면 위험하다는 것을 안다. 이런 물리 직관은 어린 시절 수천 번의 경험에서 형성된다.

로봇에게도 이런 월드 모델이 필요하다. 물건을 집으려면 그 물건의 무게, 재질, 마찰을 예측해야 한다. 계단을 내려가려면 각 계단의 높이와 깊이를 파악하고, 중심을 이동해야 한다.

현재 Physical AI의 월드 모델은 두 가지 방식으로 만들어진다.

첫째, 시뮬레이션. 가상 물리 환경에서 수십만 번의 시행착오를 거친다. 엔비디아의 Omniverse나 구글 딥마인드의 시뮬레이션 환경이 이것을 제공한다. 장점은 빠르고 안전하다는 것이다. 단점은 시뮬레이션과 현실의 차이, 즉 Sim-to-Real gap이 있다는 것이다.

둘째, 실제 환경에서의 학습. 로봇이 실제로 물건을 잡고, 넘어지고, 부딪히면서 배운다. 느리지만 현실에 더 가깝다. 구글의 RT-2, 테슬라의 옵티머스가 이 방식을 사용한다.

얀 르쿤이 LLM의 한계를 비판하면서 대안으로 제시하는 것이 바로 월드 모델이다. 그의 비전은 이것이다. 텍스트를 학습하는 대신 물리적 세계의 영상을 학습하는 AI. 물리 법칙을 내면화한 AI. 그런 AI만이 진짜 "이해"에 가까워질 수 있다고 그는 주장한다.

6.7 시니어 케어 RC카 — Physical AI의 가정 진입

거대한 휴머노이드만이 Physical AI가 아니다. 더 작고, 더 저렴하고, 더 현실적인 진입점이 있다.

독거 노인의 가정을 생각해보자. 낙상은 노인 사고 사망의 가장 큰 원인이다. 밤에 화장실에 가다가, 문턱에 걸려서, 아무도 없는 집에서. 발견이 늦으면 생명이 위험하다.

여기에 카메라와 센서를 단 RC카 크기의 로봇이 있다면 어떨까. 비전 AI가 노인의 자세를 분석하고, 움직임 패턴의 변화를 감지하고, 낙상 전조를 예측한다. 위험 신호가 감지되면 보호자에게 알린다. 비용은 20만 원 수준이다. 휴머노이드의 1/100이다.

이것이 Physical AI의 또 다른 얼굴이다. 거대하고 비싼 로봇만이 아니라, 작고 저렴하고 특화된 로봇이 실제 삶에 먼저 들어올 수 있다. 3권 13장에서 이 시니어 케어 RC카 프로젝트를 구체적으로 다룬다. 디지털 트윈 시뮬레이션에서 실물 전환까지, 9-에이전트 GoT 아키텍처로 설계하는 과정을 본다.

6.8 한국의 위치

Physical AI에서 한국은 어디에 있는가. 세계 최고의 다리 달린 로봇 기술을 확보했다. 스팟이 공장을 돌아다니고, 아틀라스가 물류를 처리한다. 이제 여기에 AI를 결합하는 것이 과제다.

삼성전자는 가정용 로봇 Ballie를 개발하고 있다. 아직 초기 단계이지만, 가정이라는 복잡한 물리 환경에서 작동하는 AI를 만드려는 시도다.

네이버는 실내 로봇 배송 시스템을 세종시 건물에 실제로 배치했다. 엘리베이터를 타고, 복도를 지나고, 문 앞에 배달한다. 단순해 보이지만 이것이 작동하려면 상당한 수준의 물리 환경 이해가 필요하다.

그러나 솔직히 말하면, 한국은 Physical AI에서 미국과 중국에 뒤처져 있다. 테슬라, 엔비디아, 구글이 선도하고, 유니트리와 샤오미가 빠르게 추격하는 구도에서 한국은 아직 뚜렷한 존재감을 보이지 못하고 있다. 보스턴 다이내믹스라는 하드웨어 자산을 AI와 어떻게 결합하느냐가 현대의 과제이자 한국의 과제다.

잠시 멈추고 생각해보자
Physical AI가 보편화되면 우리의 일상은 어떻게 달라질까? 아침에 로봇이 커피를 내려주고, 출근길에 자율주행차를 타고, 회사에서 로봇 동료와 일하는 일상. 그것은 유토피아인가, 디스토피아인가, 아니면 그냥 새로운 일상인가?

6.9 몸의 의미

이 장을 정리하자.

AI가 몸을 가진다는 것은 단순한 기술 발전이 아니다. 철학적 전환이다. 정보 처리에 머물던 AI가 물리적 세계로 나올 때, 경험과 의식에 대한 질문이 다시 열린다.

체화된 인지의 관점에서, 몸은 사고의 부속품이 아니라 사고의 기반이다. AI가 몸을 갖게 되면, 디지털 AI와는 질적으로 다른 종류의 "이해"가 가능해질 수도 있다.

그러나 동시에, 몸을 가진 AI는 물리적 위험도 가진다. 실수가 생명을 위협할 수 있다. 그래서 Physical AI에는 디지털 AI보다 훨씬 엄격한 안전 기준이 필요하다.

나는 Physical AI가 이 세기의 가장 큰 변화 중 하나가 될 것이라 본다. 디지털 AI가 정보의 세계를 바꿨다면, Physical AI는 물질의 세계를 바꾼다. 그리고 인간은 물질의 세계에 산다.

AI가 우리와 같은 세계에 몸을 갖고 나타날 때, "인간이란 무엇인가"라는 질문은 더 이상 철학 교수의 것이 아니다. 모든 사람의 질문이 된다.

다음 장에서는 다른 각도에서 인간의 고유성을 본다. 지식과 지혜의 차이. AI가 아무리 많이 알아도, 아는 것과 지혜로운 것은 같지 않다.

핵심 정리

Physical AI는 디지털 AI와 근본적으로 다르다. 예측이 물리적 결과를 가지기 때문이다. 실수의 대가가 다르고, 요구되는 정확도의 기준이 다르다.

체화된 인지는 사고가 뇌만이 아니라 몸 전체에서 일어난다는 관점이다. 이 관점에서 몸이 없는 AI는 진정한 이해에 도달하기 어렵다.

Physical AI가 물리적 세계와 상호작용하면 디지털 AI보다 풍부한 세계 표상을 만들 수 있다. 그러나 그것이 인간의 체화된 인지와 같은 것인지는 아직 알 수 없다.

월드 모델은 Physical AI의 핵심이다. AI가 물리 법칙을 내면화해야 물리적 세계에서 안전하게 작동할 수 있다.

한국은 현대로보틱스(보스턴 다이내믹스)라는 하드웨어 자산을 갖고 있지만, Physical AI의 소프트웨어 경쟁에서는 아직 위치를 잡지 못하고 있다.

반드시 답해봐야 할 질문 5가지

질문 1. AI가 몸을 갖게 되면 의식 문제에 대한 당신의 답이 달라지는가? 텍스트만 처리하는 AI와 물리적 세계에서 활동하는 AI를 같은 범주로 볼 수 있는가?

질문 2. 체화된 인지 관점에서, 현재의 LLM이 "이해"할 수 없는 것은 구체적으로 무엇인가? 당신의 직업에서 체화된 경험이 필수적인 판단의 사례를 들 수 있는가?

질문 3. Physical AI의 실수가 물리적 피해를 줄 수 있다는 사실은, AI 개발의 속도를 늦춰야 한다는 근거가 되는가? 안전과 발전 사이의 균형은 어디에 있는가?

질문 4. 월드 모델이 완벽해진 AI가 있다면, 그 AI는 물리적 세계를 "이해"한다고 볼 수 있는가? 시뮬레이션에서 학습한 물리 법칙과 실제로 경험한 물리 법칙은 같은 것인가?

질문 5. 10년 후, Physical AI가 일상에 보편화되었을 때, 당신의 삶에서 가장 크게 달라질 것은 무엇이라 예상하는가?

더 깊이 탐구하기

조지 레이코프·마크 존슨, 「몸의 철학」 (원제: Philosophy in the Flesh, 1999). 체화된 인지의 철학적 기초. 추상적 사고가 신체적 경험의 은유에 기반한다는 주장.

엔비디아 GTC 2024-2025 기조연설 시리즈. 젠슨 황의 Physical AI 비전과 Omniverse/Isaac/Cosmos 플랫폼.

테슬라 AI Day 프레젠테이션. 옵티머스 로봇의 설계 철학과 현재 진행 상황.

얀 르쿤, 「A Path Towards Autonomous Machine Intelligence」 (2022). 월드 모델 기반 AI의 비전. LLM을 넘어서는 방향 제시.

한국로봇산업진흥원 연차 보고서. 한국 로보틱스 산업의 현재 좌표와 과제.

다음 장에서는 또 다른 각도에서 인간의 고유성을 본다. AI가 아무리 많이 알아도, 아는 것과 지혜로운 것은 같은 것이 아니다. 지식과 지혜의 차이. 그리고 그 차이가 AI 시대에 왜 더 중요해지는지.