인공지능(AI)은 이제 단순히 화면 속에서 텍스트를 만들어내는 소프트웨어가 아니라 현실 세계의 기계와 설비를 직접 움직이는 ‘피지컬 AI’로 빠르게 확장되고 있다. 화면 속에서만 돌아가던 AI가 현실 세계로 튀어나온 버전이라고 보면 된다.
기존 AI는 데이터만 분석하는 소프트웨어에 가까웠다면, 피지컬 AI는 여기서 한 단계 더 진보되어 로봇이 실제 세상을 보고 이해하고 스스로 움직이게 만드는 기술이다. 카메라와 센서로 주변을 인식하고 상황을 판단한 뒤 모터와 관절을 움직여 직접 행동까지 이어가는 미래 기술이라고 할 수 있다.
피지컬 AI의 출발점에는 ‘멀티모달 AI’가 있다. 예전 AI가 주로 텍스트 하나만 다뤘다면 이제는 글, 이미지, 음성, 영상, 3D 데이터 등을 한꺼번에 이해하는 멀티모달 모델로 발전하고 있다.
‘설명 글’을 주면 그에 맞는 이미지를 만들고, 영상과 음성을 같이 보고 현 상황을 파악하는 방식으로, 사람처럼 여러 감각을 섞어서 인식하고 반응할 수 있게 된 것이다. 산업 적용을 보면 로봇, 자율주행, 스마트 공간이 대표적이다. 창고로봇은 복잡한 통로를 스스로 찾아다니며 물건을 집고 나르고 공장 로봇 팔은 카메라로 물체의 모양과 위치를 인식해 힘을 조절하며 작업한다.
자율주행차는 카메라와 라이다 등 센서 데이터를 실시간으로 분석해 도로 환경을 이해하고 보행자, 날씨, 교통상황을 고려해 최적의 경로를 선택한다.
피지컬 AI 생태계의 대표 기업으로 엔비디아(NVDA US)가 있다. 엔비디아는 피지컬 AI 생태계에서 근본적인 소프트웨어와 하드웨어를 제공한다. 로봇 회사나 자율주행 업체가 피지컬 AI를 만들려면 가상으로 시험해 볼 연습장과 공장을 미리 그려보는 설계도 그리고 기계에 힘을 실어 줄 고성능 칩이 필요하다. 엔비디아는 이런 것들을 한꺼번에 묶어서 제공하는 회사다.