ABBYY FineReader Engine (SDK) 将科研论文转换为数字知识
客户概况 | 中国国家知识基础设施工程 ( CNKI ) 是一项得到中国教育 |
解决方案
为了寻找替换的 OCR 核心解决方案,CNKI 致函上海泰彼信息技术有限公司,全球领先的 OCR 与数据采集技术提供商 ABBYY在中国的代表处。
为了在最短时间内完成积压资料的数字化,泰彼公司建议采用 ABBYY FineReader Engine — OCR 软件开发工具包方案,以实现与 CNKI 现有环境进行深度无缝整合。
在数字化第一阶段,ABBYY FineReader Engine识别出文档中的所有 文本。在第二阶段,该引擎从文档内容中抓取检索值 ( 元数据 )。利用元数据,可以实现知识数据库中数字化资料的快速高效检索。
与以往的 OCR 方案相比,ABBYY FineReader Engine能够保存文 档的原始布局,并将经过处理的文档导出为 Microsoft® Word 文 档、Excel® 文档、可检索的 PDF/A 文件,以及符合中国国家标准的 CAJ 本土格式文件。
只需一名操作员,即可快速轻松地校验 ABBYY OCR 识别结果,并确保检索结果 100% 精确。
最终成果
采用 ABBYY OCR 技术后,CNKI 显著提高了资料处理速度与精度,减少了人工干预。ABBYY FineReader Engine的智能文档分析功能保 存了导出文档的结构与布局,确保文档将来在 CNKI 数据库中的有效使用和存储。
通过使用多核处理,资料识别速度得到了显著提升。在过去,同样的任务需要耗费数周时间,而现在仅仅需要几天。得益于自动化资料处理,CNKI 能够将原本从事人工录入和校验资料工作的数十名员工解放出来,投入其他项目的工作,大幅提高了生产力。
最重要的是,这类大规模数字化工程的最深远影响在于提升了使用者舒适度。现在这一全球平台的用户都可以更快的速度、更高的准确度搜索到所需信息。 ABBYY 的数字化解决方案令中国国家范围的知识更易于检索、便于使用,完美践行了 ABBYY 的企业使命 — 知行合一。