뉴밍

AI 뉴스 플랫폼, 흩어진 뉴스를 잇다

앱으로 보기

LG AI 연구원, 멀티모달 AI 모델 '엑사원 4.5' 공개

게시2026년 4월 9일 10:01

AI가 1개의 뉴스를 요약했어요.

LG AI 연구원이 9일 텍스트와 이미지를 동시에 이해하는 멀티모달 AI 모델 '엑사원 4.5'를 공개했다. 자체 개발한 비전 인코더와 거대언어모델을 통합한 비전-언어 모델로, 계약서·기술 도면·재무제표 등 산업 현장의 복합 문서를 정확하게 읽고 추론하는 능력에 강점이 있다.

벤치마크 평가에서 엑사원 4.5는 STEM 성능 5개 지표 평균 77.3점을 기록해 오픈AI GPT-4o mini(73.5점), 앤트로픽 클로드 소넷 4.5(74.6점), 알리바바 큐웬 3 235B(77.0점)를 모두 앞섰다. 이는 AI가 문서 속 글자와 비정형 데이터를 단순히 인식하는 수준을 넘어 맥락을 파악하고 질문에 답할 수 있는 이해력을 갖췄음을 의미한다.

엑사원 4.5는 독자 AI 파운데이션 모델 프로젝트 'K-엑사원'의 모달리티 확장을 위한 준비 단계로, 궁극적으로 가상 환경을 넘어 물리적 세계를 이해하는 피지컬 인텔리전스로 발전시키는 것을 목표로 하고 있다.

[LG AI 연구원]

AI 뉴스 플랫폼, 흩어진 뉴스를 잇다

Newming
Google Play에서 다운로드App Store에서 다운로드