介绍
在过去几周,我在业余时间里利用ABBYY开发的FineReader Engine试用版来开发了一些简单的OCR应用程序。FineReader Engine是1个软件开发工具包,用来开发功能强大的应用程序,以打开图像、PDF文档和扫描文档,分析和解析内容并输出结果。它们几乎能够生成任何一种包含文本结果的导出文件,包括基于文本的PDF格式、微软Office格式、XML格式(尤其有助于让OCR结果与其他系统配套使用)等等。
关于ABBYYFineReader Engine
ABBYY网站上对FineReaderEngine的描述如下:
ABBYY FineReader Engine是一款功能强大的光学字符识别(OCR)软件开发工具包(SDK),集成了ABBYY最先进的文档识别和转换软件技术,如:光学字符识别(OCR)、智能字符识别(ICR)、光学标记识别(OMR)、条形码识别(OBR)、文档影像和PDF转换。
如果开发人员需要开发具有以下任一功能的应用程序,可以考虑使用ABBYY FineReader Engine软件开发工具包(SDK):
•文档转换
•文件归档
•文件分类
•书籍归档
•文本提取
•字段识别
•条码识别
•名片识别
•图像预处理
•扫描
这个SDK中包含有十几个应用程序示例,包括C++、C#、VB.NET、VB、Delphi、Java和几种脚本语言(JavaScript、Perl和VBScript)示例。你可以查看代码开发库(Code Development Library)来快速入门,代码开发库中包含了SDK编程的各个方面。每个截面代码库包含一个或多个代码片段并逐步描述了如何运行一项任务。
选择你需要执行的任务,查看操作步骤描述,查阅源代码示例或运行可执行文件:
安装和设置
在开发机上安装FineReader时有几个步骤。首先,必须安装授权服务器。如果只有1个开发人员使用SDK,此时可以将它直接安装在开发机上。如果多个开发人员要从多个工作站使用FineReader,此时应该将授权服务器安装在所有开发人员都能访问的应用程序服务器上。授权服务器必须安装在物理机器上,而不是虚拟机上。(请注意,该技术可以在虚拟机和云环境中运行)。通过授权管理器,您可以添加和激活您的许可证,无论您的许可证是