国内的OCR扫描识别软件。
一般通用的文档扫描软件,只能扫描识别简单的简体中文。
对于像纯英文、韩语、日语等的识别技术相对来说难度较大。
对于像这种外文文字的识别,需要更强大的识别核心技术。要具备高性能的文字识别引擎。
包括编码格式都需要达到国际的编码标准,比如UNICODE编码。
目前对于韩语、日语等外籍文字的扫描识别,一般还是集中在对于大幅面的文档扫描识别。
简体中文和繁体中文,大都集中在报社的报纸以及出版物数字化方面的应用。
要把印刷的文档转化为可以供阅读和可编辑的高质量电子文档。已经是现代的一种市场需求。
只有转化为电子版,才能应用到各类数据库、电子出版物、数字图书馆等。。。
但是目前很多报社都是采取手工录入的方式。
耗费的人力成本和浪费的时间更是让行业内人员苦不堪言。
其实对于这种行业市场趋势和行业问题的解决。有很多厂商和技术开发厂