LG가 선보인 국내 첫 추론 AI '엑사원 딥'
오픈소스로 공개…글로벌 AI 시장서 경쟁 본격화
25년 수능 수학 94.5점
(서울=연합인포맥스) 유수진 기자 = LG AI연구원이 18일 자체 개발한 추론 인공지능(AI) '엑사원 딥(EXAONE Deep)'을 공개하고 글로벌 추론 AI 모델과의 경쟁을 공식화했다.
이를 두고 국내 기업의 첫 추론 AI가 글로벌 AI 시장에서 본격적으로 경쟁력을 입증했다는 데 의미가 있다는 해석이 나왔다.
[출처: 연합뉴스 자료사진]
LG AI연구원은 이날 '엑사원 딥'을 오픈소스로 공개하며 '에이전틱(Agentic) AI' 시대로의 전환을 예고했다. 연구원은 현지 시각 17일부터 21일까지 미국 캘리포니아주 새너제이에서 열리는 엔비디아의 연례 개발자 콘퍼런스(GTC)에 참가해 '엑사원 딥'을 선보인다.
에이전틱 AI는 스스로 가설을 세우고 이를 검증하기 위한 추론을 진행하는 과정을 통해 자율적으로 의사결정을 할 수 있는 능동적인 AI를 의미한다. 이를 구현하기 위해선 기존 '지식 AI'를 넘어서는 '추론 AI' 개발이 필수적이다.
현재 전 세계적으로 자체 추론 AI를 개발하고 있는 곳은 몇 군데밖에 없다. 미국의 오픈AI와 구글, 중국의 딥시크와 알리바바 등 파운데이션 모델(Foundation Model)을 보유한 소수의 기업이 여기에 해당한다. '엑사원 딥'은 이들과 경쟁할 수 있는 국내 첫 모델이라는 데 의의가 있다.
LG AI연구원은 글로벌 오픈소스 AI 플랫폼 '허깅 페이스(Hugging Face)'에 매개변수가 다른 3가지 '엑사원 딥'의 논리적 사고력과 문제해결 능력을 평가하는 다양한 성능 평가 결과를 공개했다.
이중 '엑사원 딥-32B(320억 개 매개변수)'는 중국의 딥시크 R1(6천710억 개 매개변수)의 5%에 해당하는 매개변수만으로도 미국과 중국 모델들과의 비교에서 우수한 성능을 보였다.
[출처:LG AI연구원]
일례로 복잡한 수학 문제와 과학 문제 해결 능력에서 우수성을 입증했다. 해당 모델은 한국어에 강점이 있는 엑사원 파운데이션 모델을 기반으로 해 2025학년도 수능 수학 영역에서 94.5점으로 최고점을 기록했다. 심지어 선택과목(확률과 통계, 미적분, 기하) 모두에서 1등급을 달성하기도 했다.
또한 물리학, 화학, 생물학 등 박사 수준의 과학 추론 능력을 평가하는 지표에서도 우수한 성능을 뽐냈다.
과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서 66.1점을 받아 매개변수 규모가 유사한 추론 AI 모델과의 경쟁에서 앞서는 결과를 기록했다. 코딩 능력을 평가하는 라이브 코드 벤치(LiveCodeBench)에서도 59.5점을 얻어 경쟁력을 입증했다.
LG AI연구원은 '엑사원 딥'이 수학과 과학, 코딩 등 전문 분야 평가 지표에서 높은 성능을 보여줌으로써 향후 기업이 필요로 하는 전문 분야뿐만 아니라 물리와 화학 등 과학 연구와 교육 현장에서 활용도가 높아질 것으로 기대한다.
연구원은 경량 모델 '엑사원 딥-7.8B', 온디바이스 모델 '엑사원 딥-2.4B'도 오픈소스로 함께 공개했다.
경량 모델은 32B의 24% 크기임에도 성능을 95%까지 유지하며, 온디바이스 모델은 7.5% 규모임에도 성능이 86%에 달해 높은 경제성과 실용성을 동시에 갖췄다.
실제로 경량 모델인 7.8B의 성능은 미국 오픈AI의 o1-mini의 성능을 상회했으며, 온디바이스 모델인 2.4B 또한 동급 모델과의 성능 비교 평가에서 세계 최고 수준의 성능을 보였다.
LG AI연구원은 LG전자[066570]와 LG유플러스[032640] 등 LG[003550] 계열사들과 함께 모델을 고도화해 온디바이스 AI 시장을 주도해 나간다는 계획이다.
sjyoo@yna.co.kr
<저작권자 (c) 연합인포맥스, 무단전재 및 재배포 금지, AI 학습 및 활용 금지>