[출처: 엔비디아]
(서울=연합인포맥스) 윤영숙 기자 = 엔비디아가 에이전틱 AI 애플리케이션 개발을 위한 차세대 오픈 모델 제품군 '네모트론 3(Nemotron 3)'를 공개하며 AI 생태계 확장에 본격적으로 나섰다.
네모트론 3는 자체 오픈소스 대형언어모델(LLM)로 오픈 모델·데이터·라이브러리로 구성된 통합 오픈 스택이다. 투명성과 효율성, 전문화를 동시에 충족하는 것이 특징이다.
네모트론 3는 나노(Nano), 슈퍼(Super), 울트라(Ultra) 세 가지 모델로 구성되며, 신규 하이브리드 전문가 혼합 방식(Mixture-of-Experts, MoE) 아키텍처 기반으로 설계됐다.
네모트론 3는 높은 정확도와 효율성을 갖춘 오픈 모델 제품군으로, 에이전틱 AI 애플리케이션 구축에 이상적이다.
나노 모델은 전 세대 대비 최대 4배 높은 토큰 처리량을 기록하며, 추론 토큰 생성량을 최대 60% 줄여 비용 효율성을 크게 높였다. 100만 토큰 컨텍스트 윈도도 지원해 장기·다단계 추론 성능을 강화했다.
슈퍼 모델은 약 1천억 개 파라미터 기반의 고정확도 추론에 특화됐고, 울트라는 약 5천억 개 파라미터를 갖춘 대규모 추론 엔진으로 복잡한 AI 워크플로우를 지원한다.
네모트론 3는 소버린 AI 전략의 핵심 축으로, 액센츄어·딜로이트·팔란티어·퍼플렉시티·서비스나우 등 글로벌 기업들이 초기 도입에 나섰다. 나노 모델은 현재 제공 중이며, 슈퍼와 울트라는 2026년 상반기 공개될 예정이다.
엔비디아는 오픈 모델과 함께 3조 토큰 규모의 훈련 데이터세트, 강화학습 라이브러리 NeMo Gym·NeMo RL, 성능 검증 도구 이벨류에이터(Evaluator)도 공개했다. 모든 도구는 깃허브와 허깅페이스에서 제공된다.
한편, 엔비디아는 이날 고성능 컴퓨팅(HPC)과 AI 오픈소스 생태계 강화를 위해 워크로드 관리 시스템 '슬럼(Slurm)' 개발사 스케드엠디(SchedMD)를 인수했다고 밝혔다.
엔비디아는 이번 인수를 통해 가속 컴퓨팅 플랫폼과 슬럼을 결합해 대규모 HPC·AI 워크로드의 스케줄링과 자원 활용 효율을 한층 끌어올린다는 전략이다.
슬럼은 HPC·AI 클러스터에서 병렬 작업을 효율적으로 관리하는 오픈소스 워크로드 관리자 겸 스케줄러로, TOP500 슈퍼컴퓨터 상위 10개와 상위 100개 시스템의 절반 이상에서 사용될 만큼 업계 표준으로 자리 잡았다.
ysyoon@yna.co.kr
윤영숙
ysyoon@yna.co.kr
금융용어사전
금융용어사전