介绍
我之前介绍了ABBYY OCR及数据捕捉软件开发工具包,随后我收到了几份用户和公司的电子邮件,他们对两种技术的区别仍不太了解,也不清楚如何针对具体应用方案进行选择。因此,我决定介绍两种软件开发工具包(SDK),并解释如何针对具体任务进行选择。
以下是FineReaderEngine及FlexiCapture Engine的各自功能及应用情景。
■ FineReaderEngine是一款传统OCR工具包,设计用于将图像文件及图像PDF文件转换为纯文本、Office格式、HTML、可搜索PDF或XML。原始文件页面布局的分析与储存有多种方案。
■ FlexiCaptureEngine与FineReader Engine基于相同的ABBYY核心OCR技术,但这款SDK的主要目的是文件分离、归类及数据提取。FlexiLayout技术将使用核心内部布局信息,然后找出业务流程所需的数据。
以下简要介绍它们在文件分析方面的区别: