
LG AI 연구원, 멀티모달 AI 모델 '엑사원 4.5' 공개
게시2026년 4월 9일 10:01
newming AI
AI가 1개의 뉴스를 요약했어요.
LG AI 연구원이 9일 텍스트와 이미지를 동시에 이해하는 멀티모달 AI 모델 '엑사원 4.5'를 공개했다. 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로, 계약서·기술 도면·재무제표 등 산업 현장의 복합 문서를 정확하게 읽고 추론하는 능력에 강점이 있다.
벤치마크 평가에서 엑사원 4.5는 STEM 성능 5개 지표 평균 77.3점을 기록해 오픈AI GPT-4o mini(73.5점), 앤트로픽 클로드 소넷 4.5(74.6점), 알리바바 큐웬 3 235B(77.0점)를 모두 앞섰다. 이는 AI가 문서 속 글자와 비정형 데이터를 단순히 인식하는 수준을 넘어 맥락을 파악하고 질문에 답할 수 있는 이해력을 갖췄음을 의미한다.
엑사원 4.5는 독자 AI 파운데이션 모델 프로젝트 'K-엑사원'의 모달리티 확장을 위한 준비 단계로, 궁극적으로 가상 환경을 넘어 물리적 세계를 이해하는 피지컬 인텔리전스로 발전시키는 것을 목표로 하고 있다.

“텍스트·이미지 이해하고 추론까지”…LG, 멀티모달 AI ‘엑사원 4.5’ 공개