
나라지식정보, CRF 기반 고문서 AI 해독기술 'NARA OCR' 개발
게시2025년 12월 30일 01:01
newming AI
AI가 1개의 뉴스를 요약했어요.
AI 데이터 솔루션 전문 기업 나라지식정보가 고문서 AI 해독기술 'NARA OCR'을 개발해 문화유산 디지털화 분야를 선도하고 있다.
NARA OCR은 손상된 고문헌 복원, 문자 인식, 정렬, 문장·구절 경계 식별을 한 번에 수행하며, 비정형 옛 문서를 구조화된 데이터로 변환한다. Hidden Text PDF 형식으로 제공되어 원본 이미지의 시각적 진본성을 유지하면서도 텍스트 검색과 복사가 가능하며, RAG DB 및 LLM 등 AI 서비스와 바로 연동된다.
이 기술의 혁신성은 국내외에서 인정받고 있다. 올해 베이징 국제 디지털인문학 학술대회에서 우수 연구로 선정되었으며, AI 챔피언십에서 초거대언어모델 '주춧돌LM'이 한국정보통신기술협회상을 수상했다.

손상된 고문헌, AI 이용 복원해 데이터로 변환