LG AI 연구원, 멀티모달 AI 모델 '엑사원 4.5' 공개

게시2026년 4월 9일 10:01

newming AI

AI가 1개의 뉴스를 요약했어요.

LG AI 연구원이 9일 텍스트와 이미지를 동시에 이해하는 멀티모달 AI 모델 '엑사원 4.5'를 공개했다. 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로, 계약서·기술 도면·재무제표 등 산업 현장의 복합 문서를 정확하게 읽고 추론하는 능력에 강점이 있다.

벤치마크 평가에서 엑사원 4.5는 STEM 성능 5개 지표 평균 77.3점을 기록해 오픈AI GPT-4o mini(73.5점), 앤트로픽 클로드 소넷 4.5(74.6점), 알리바바 큐웬 3 235B(77.0점)를 모두 앞섰다. 이는 AI가 문서 속 글자와 비정형 데이터를 단순히 인식하는 수준을 넘어 맥락을 파악하고 질문에 답할 수 있는 이해력을 갖췄음을 의미한다.

엑사원 4.5는 독자 AI 파운데이션 모델 프로젝트 'K-엑사원'의 모달리티 확장을 위한 준비 단계로, 궁극적으로 가상 환경을 넘어 물리적 세계를 이해하는 피지컬 인텔리전스로 발전시키는 것을 목표로 하고 있다.

“텍스트·이미지 이해하고 추론까지”…LG, 멀티모달 AI ‘엑사원 4.5’ 공개

뉴밍

LG AI 연구원, 멀티모달 AI 모델 '엑사원 4.5' 공개