ABBYY FlexiCapture Engine 10.0：创建模板识别的新工具

最新推荐文章于 2024-08-22 09:29:25 发布

ocr-developer

最新推荐文章于 2024-08-22 09:29:25 发布

阅读量3.7k

点赞数

分类专栏： ABBYY FlexiCapture Engine 10.0 文章标签： ABBYY OCR FlexiCapture Engine 软件开发 SDK

本文链接：https://blog.csdn.net/u014337082/article/details/38868011

版权

ABBYY FlexiCapture Engine 10.0 专栏收录该内容

1 篇文章

订阅专栏

本文介绍如何利用ABBYY FlexiCaptureEngine10.0及其API快速配置数据提取解决方案，通过易用工具在几分钟内创建模板，简化文档处理流程。文章详细阐述了新工具的使用方法、限制与优势，以及如何针对实际数据识别任务创建精确模板。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

实现数据提取快速配置（适用于简单类型的文档）是ABBYY FlexiCapture Engine 10.0这个软件开发工具包的一大特点。为了让用户可以充分使用该功能，ABBYY FlexiCaptureEngine 10.0中特意配置了API。此外，我们还创建了一个易用工具（也提供了源代码形式），使用这个工具，用户可以在几分钟内创建数据提取解决方案模板。

这篇文章由开发人员撰写，并面向开发人员介绍了这项技术的特点和局限性——这些内容在宣传材料中是找不到的。

限制数据捕获技术推广的原因之一是：用户需要在最初投入时间和精力来使用这个软件处理某些类型的文档。为此，开发人员/ 集成人员需要掌握大量新工具，并熟悉数据采集技术的细节；然后，他们才能创建解决方案模板并评估整个项目的效益。

有了这套新工具以后，用户就暂时不必了解数据采集技术的细枝末节。这项新功能并不能完全取代FlexiLayout Studio，但用户可以利用它完成简单的识别任务，提取必要的数据，或为复杂的识别任务创建简单实用的模板。

要使用API提取数据，只需书写几行代码，其中包括以下内容：

// 创建FlexiCapture处理器，并使用一个或多个文档定义文件来配置处理器

IFlexiCaptureProcessorprocessor = engine.CreateFlexiCaptureProcessor();

processor.AddDocumentDefinitionFile(sampleFolder + "Invoice_eng.fcdot" );

这行代码用于配置FlexiCapture工具，使之能够处理特定类型的文档。

扩展名为FCODT（FlexiCapture文档模板）的文件中包含了对数据提取对象及应用限制的描述、在图像中定位相关数据的方法、识别设置以及导出设置（可选）。该文件是使用Flexilayout Studio工具在FlexiCapture中创建的。

处理样本任务很容易。但我们如何才能针对现实中的数据识别任务，创建精确的文档定义呢？

在ABBYY FlexiCapture10发布之前，您需要安装FlexiCapture桌面版，并学会使用其文档定义工具和FlexiLayout Studio。同时，该最新版本中包含“自动生成模板”的软件向导，您可以利用向导在几分钟之内创建出有效的模板。下面，我们结合实例来看看它的工作原理。

问题