'‘엔비디아, 오늘 제일 싸다’ 유효… AI 진화로 투자매력 더 높아질 것

최신글
2025.04.01

읽는시간 4

0
AI 복잡한 추론하게 될수록
토큰 생성량 더 많아지게 돼
데이터센터 투자 증가할 것

블랙웰 울트라·베라 루빈 등
차세대 AI칩 출시 예고 더해
AI 추론 모델로 기대감 높여

엔비디아가 주최하는 글로벌 인공지능(AI) 콘퍼런스에서 젠슨 황 엔비디아 CEO는 AI의 새로운 진화 단계를 제시해 눈길을 끌었다. 그는 현재의 AI 트렌드가 ‘생성형 AI’에서 ‘에이전틱(스스로 의사결정) AI’로 변화하고 있으며, 그다음은 ‘피지컬(물리적) AI’로 이어질 것으로 분석했다.

이 경우 AI가 더 복잡한 추론과 생각을 하게 되는데, 이는 ‘토큰(token·문장을 잘게 쪼갠 단어나 글자 조각)’ 생성량이 많아질 것이다. 토큰의 생성량이 많아질수록 컴퓨팅 사용량도 높아진다. 이 경우 데이터센터의 투자는 더욱 증가할 것이고 이에 따라 엔비디아의 수요를 지속적으로 증가시키는 선순환을 이끌 것으로 기대된다. 엔비디아 주가가 ‘오늘이 제일 싸다’는 믿음은 여전히 유효하다.

◇AI 어떻게 진화하고 있나 = 기존의 생성형 AI와 달리 에이전틱 AI는 토큰의 양을 더 많이 생성해낸다. 기존 생성형 AI의 경우 질문에 대한 답만 골라내는 방식이지만, 에이전틱 AI는 스스로 질문을 추론하고 다양한 경우의 수를 도입하는 방식이기에 ‘추론형 모델(Reasoning AI)’로 불리고 있다.

이에 따라 데이터센터의 활용도도 기존에는 데이터를 저장하고 이용하는 방식에서 토큰을 생성해내는 방식으로 바뀌게 될 것으로 엔비디아는 예상하고 있다.

엔비디아는 변화하고 있는 AI 시대에 맞춰 이번 GTC 2025에서 다양한 하드웨어와 소프트웨어 솔루션을 선보였다. 하드웨어의 하이라이트는 블랙웰 GPU의 업그레이드 버전인 블랙웰 울트라와 베라 루빈이었으며, 그 외 개인용 PC(DGX 스파크·DGX 스테이션), 데이터 전송을 효율적으로 관리하는 NV링크, 스펙트럼 X를 선보였다.

소프트웨어의 핵심은 하드웨어 가속화에 맞춰졌다. 엔비디아는 블랙웰 GPU의 가속화를 위해 다이나모 솔루션을 선보였다. 다이나모를 통해 블랙웰을 운영할 경우 기존 호퍼칩 대비 약 40배의 성능이 개선되는 모습을 보였다. 그 외 머신러닝에 특화된 쿠다 X, 자율주행 솔루션 할로스 등을 선보였다.

◇‘블랙웰 울트라’ 차기 AI 시장 선도 = 엔비디아가 이번 GTC 2025에서 공개한 블랙웰 울트라는 기존 블랙웰 시리즈를 강화한 모델이다. 울트라는 기존 블랙웰 대비 메모리 용량이 50% 이상 증가하고 성능도 크게 향상됐으며, 기존 모델보다 전력을 덜 사용하면서 더 많은 작업을 수행하도록 설계됐다.

올해 하반기에 공식 출시 예정으로 AI 추론, 에이전틱 AI, 피지컬 AI 등의 앱 개발을 가속화할 차세대 AI 인프라에 중요한 역할을 할 것으로 엔비디아는 기대하고 있다.

블랙웰 울트라는 에이전틱 AI와 피지컬 AI 앱에도 최적화돼 있다. 에이전틱 AI는 다단계 문제 해결을 위한 고급 추론 및 계획 기능을 갖춘 AI 시스템으로, 단순한 명령 수행을 넘어 독자적인 의사 결정과 실행이 가능하다. 피지컬 AI는 자율주행 및 로봇 훈련을 위한 실시간 합성 비디오 생성을 지원해 보다 정밀한 AI 모델 학습을 가능하게 한다.

블랙웰 울트라에 기반한 제품들은 블랙웰 울트라 인도 일정에 맞춰 2025년 하반기부터 출시될 예정이다. 시스코, 델 등 주요 서버 제조업체뿐만 아니라 아마존웹서비스(AWS), 구글 클라우드, 마이크로소프트 애저 등 GPU 클라우드 업체도 제공할 계획이다.

엔비디아는 차세대 AI 반도체이자 블랙웰 울트라의 후속 모델인 베라 루빈을 공개했다. 모델명은 천문학자인 베라 루빈의 이름에서 가져왔고, 공식적으로 2026년 하반기에 출시할 예정이다.

엔비디아가 자체 설계한 첫 맞춤형 CPU ‘베라’와 차세대 GPU 루빈으로 구성되는 것이 특징이다. 루빈 GPU는 AI 추론 시 50페타플롭스(PFLOPS)의 성능을 발휘한다. 이는 현재 출시된 블랙웰 GPU(20PFLOPS) 대비 약 2.5배로 향상된 수준이다.

◇AI 소프트웨어 생태계도 확장 = 엔비디아가 공개한 ‘다이나모 솔루션’은 모듈형 AI 추론 프레임워크로 대규모 GPU 클러스터에서 발생하는 다양한 추론 요청을 효율적으로 분산 처리하고 비용을 절감하도록 설계됐다. 엔비디아는 추론 AI 모델을 강조하고 있다.

추론 모델은 단순한 데이터 처리나 패턴 인식에서 벗어나, 인간과 유사한 논리적 추론과 다단계 문제 해결 능력을 갖췄다. 황 CEO는 오픈소스 형태로 제공되는 점도 강조했다. 엔비디아는 GTC 2025에서 자율주행 시스템의 안정성 강화를 위한 통합 시스템인 ‘할로스’를 공개했다.

할로스는 칩, 소프트웨어, 툴, 서비스까지 포함하는 ‘엔드투엔드(end-to-end)’ 자율주행 안전 프레임워크로, 클라우드에서 차량까지 AI 기반 자율주행 기술의 안전성을 보장한다. 황 CEO는 “할로스를 통해 개발자와 기업들이 안전하고 신뢰할 수 있는 자율주행차를 구축할 수 있도록 지원할 것”이라고 강조했다.

또한 엔비디아는 DGX 스파크와 DGX 스테이션을 발표하며 데스크톱 AI 슈퍼컴퓨터 시대를 열었다. DGX 스파크는 세계에서 가장 작은 AI 슈퍼컴퓨터로 GB10 그레이스 블랙웰 슈퍼칩을 탑재해 최대 1000TOPS(1초에 1000조 번)의 연산 성능을 제공한다.

기존 데이터센터에서만 가능했던 대규모 AI 모델 프로토타이핑, 세부 조정, 추론을 개인 개발자, 연구자, 데이터 과학자, 학생들도 데스크톱에서 수행할 수 있도록 지원한다.

이 콘텐츠는 '문화일보'에 등재된 기고글입니다. 
이 글은 필자의 개인적인 의견으로 소속 회사의 공식적인 의견과 다를 수 있음을 알려드립니다.

유중호

KB증권 수석연구원

미국 및 선진국 주식에 대해 분석하고, 모델 포트폴리오를 운용합니다.

유중호

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

이미지