윙배너
윙배너

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복

필기체 인식 어려운 OCR…AI 도입해 다양한 비정형 문서 대응

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
파워젠 관계자가 참관객과 대화하고 있다

이미지 파일에서 텍스트를 추출하는 광학문자인식(Optical Character Recognition, 이하 OCR)기술이 인공지능(AI) 도입으로 진화했다. 기존에는 읽기 어려웠던 필기체나 비정형 문서도 AI로 인식할 수 있다.

5일 양재동 aT센터에서 진행 중인 ‘2023 한글문화산업전시회(이하 전시회)’에 참여한 파워젠이 생성형 AI를 결합한 OCR 솔루션을 전시했다.

OCR은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 스캐너로 획득해 컴퓨터가 편집할 수 있는 문자코드 등의 형식으로 변환하는 소프트웨어다. 다양한 비즈니스 문서를 디지털화해 활용도를 높일 수 있다.

기존 OCR은 정형화된 폰트 외에는 인식이 어려웠다. 기존 폰트와 비교하는 방식이기 때문에 손으로 쓴 글씨는 인식 오류가 잦고, 표나 그림이 들어간 문서는 특히 인식률이 낮았다.

파워젠 관계자는 “정형문서는 폰트를 학습하면 거의 100%의 인식률을 보이지만, 필기체는 어려웠다”며 “AI로 문제점을 보완했다”라고 설명했다.
이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
비정형 문서 예시. 박스에 붙은 라벨도 인식한다

서명이 들어간 문서, 표나 그림이 첨부된 문서도 데이터화 할 수 있다. RPA(Robotic Process Automation)와 연동으로 추출 데이터의 가공도 가능하다.

관계자는 “고객이 추출한 1차 데이터를 자동화 툴로 가공한다”면서 “단순 데이터 추출에 그치지 않고 최종 사용자가 활용할 수 있는 형태로 만든다”라고 설명했다.


0 / 1000


많이 본 뉴스

AI 시장, 2032년 1.7조 달러 규모로 급성장... 한국 기업 '기회의 문' 열리나

글로벌 데이터 폭증과 고령화 추세가 인공지능(AI) 산업 혁명을 가속화하는 가운데, 한국 기업들의 AI 시장 진출 기회가 확대되고 있다. 가트너에 따르면 세계 AI 시장 규모는 2024년 2천334억 달러에서 2032년 1조 7천716억 달러로 연평균 29.2% 성장할 것으로 내다봤다. 특히 생성형 A

중소기업 AI 도입 지원 본격화… 정책과제와 법안 마련 착수

중소벤처기업부(중기부)는 23일 서울 광화문 빌딩에서 중소기업의 인공지능(AI) 도입·활용을 지원하기 위한 ‘중소기업 AI 정책자문단’(이하 정책자문단) 출범식을 개최했다고 밝혔다. 정책자문단은 중소기업과 소상공인의 AI 기술 활용 확대를 위해 정책과제를 도출하고, ‘(가칭)중소기업 A

AI 도입, 매출 4%·부가가치 7.6% 증가…생산성 개선은 '아직'

국내 기업의 인공지능(AI) 도입이 매출과 부가가치 향상에 기여했다는 실증 분석 결과가 나왔다. 그러나 도입률은 여전히 낮고, 특히 제조업 분야에서는 활용이 더딘 상황이다. 산업 전반의 경쟁력 강화를 위한 구조적 대응이 필요하다는 목소리가 커지고 있다. 대한상공회의소 산하 지속성장이니

AGI, 인간 지능을 넘보다… 해외 언론이 주목한 전망과 과제

인공일반지능(AGI)의 발전 가능성이 주목받고 있다. AGI는 특정 작업에 국한되지 않고 인간과 유사한 지능을 갖춘 인공지능을 의미하며, 경제·사회 전반에 미칠 영향이 클 것으로 예상된다. 해외 주요 언론과 전문가들은 AGI의 실현 가능성과 그에 따른 도전 과제, 경제적·윤리적 이슈를 다각도로

AI, 글로벌 경제의 패러다임을 바꾸다

AI 기술이 빠른 속도로 진화하면서 산업 구조와 노동시장, 각국 정책 전반에 걸쳐 근본적인 변화가 나타나고 있다. 기업은 자동화를 도입해 생산성을 높이는 한편, 정부는 연구개발 확대와 제도 정비를 통해 기술 경쟁력을 강화하고 있다. 기술 혁신을 넘어 경제 질서와 사회 시스템 전반을 새롭게






산업전시회 일정


미리가보는 전시회