0

LG AI연구원, '엑사원 4.5' 모델 공개…"피지컬 AI로 발전"

26.04.09.
읽는시간 0

임우형 LG AI연구원장

[출처: 연합뉴스 자료사진]

(서울=연합인포맥스) 김학성 기자 = LG AI연구원이 9일 차세대 비전·언어모델(VLM) '엑사원 4.5'를 공개했다. 텍스트와 이미지를 동시에 이해하고 추론하는 능력을 갖춰 실제 산업 현장에서 널리 활용될 것으로 기대를 모았다.

LG AI연구원은 엑사원 4.5에 자체 개발한 비전 인코더와 거대언어모델을 하나의 구조로 통합했다고 설명했다. 이를 통해 계약서와 기술 도면, 재무제표, 스캔 문서 등 기업에서 다루는 복잡한 문서를 정확하게 읽고 추론하는 능력을 갖췄다.

객관적인 성능 지표에서도 우수성이 입증됐다.

LG AI연구원에 따르면 엑사원 4.5는 STEM(과학·기술·공학·수학) 성능, 시각 이해, 코딩 성능 등을 평가하는 지표에서 오픈AI GPT5-미니와 앤트로픽 클로드 소넷 4.5, 중국 알리바바 큐웬3 등 경쟁 모델을 앞서는 성과를 냈다.

LG AI연구원 관계자는 "시각 능력 평가 지표에서 높은 평균 점수를 기록했다는 것은 AI가 문서 속 글자나 비정형 데이터를 단순히 인식하는 수준을 넘어 맥락을 파악하고 질문에 답할 수 있는 이해력을 갖췄다는 의미"라고 말했다.

또 LG AI연구원은 엑사원 4.5가 파라미터(330억개) 측면에서 지난해 말 공개한 'K-엑사원'의 7분의 1 크기지만, 텍스트 이해와 추론 영역에서 동등한 성능을 달성할 만큼 효율성도 갖췄다고 덧붙였다.

이번 모델은 독자 AI 파운데이션 모델 프로젝트에서 개발 중인 K-엑사원의 모달리티 확장을 위한 준비 단계다. LG AI연구원은 올해 8월 프로젝트 2차수 종료 이후 3차수 진출이 확정되면 본격적으로 모달리티 확장에 나설 계획이며, 궁극적으로 엑사원을 물리적 세계를 이해하고 판단하는 '피지컬 인텔리전스'로 발전시키는 것을 목표로 하고 있다.

LG AI연구원은 이날 엑사원 4.5를 글로벌 오픈소스 플랫폼인 허깅페이스에 연구·학술·교육 목적으로 사용할 수 있도록 공개하며 생태계 확장 행보를 계속했다.

아울러 LG AI연구원은 엑사원을 한국적 맥락을 이해하는 AI로 발전시키기 위해 동북아역사재단으로부터 데이터를 제공받아 학습을 진행하는 등 노력을 이어가고 있다고 밝혔다.

hskim@yna.co.kr

김학성

김학성

금융용어사전

KB금융그룹의 로고와 KB Think 글자가 함께 기재되어 있습니다. KB Think

금융용어사전

KB금융그룹의 로고입니다. KB라고 기재되어 있습니다 KB Think

이미지