azure云服务使用方法_使用Azure认知服务自动执行表单处理

最新推荐文章于 2023-07-26 11:18:26 发布

cxt70571

最新推荐文章于 2023-07-26 11:18:26 发布

阅读量337

点赞数

文章标签：大数据 python 机器学习人工智能深度学习

原文链接：https://www.infoworld.com/article/3528784/use-azure-cognitive-services-to-automate-forms-processing.html

版权

本文介绍了如何使用Azure认知服务中的表单识别器，通过机器学习技术解析表单结构，提取关键信息，简化数字化转型过程。表单识别器提供预训练模型和自定义模型训练，能与Power Platform等工具集成，提升数据捕获效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

azure云服务使用方法

由机器学习提供支持的 Microsoft认知服务是一种向您的应用程序添加人工智能的简便方法，使您可以按需付费，访问各种有用的算法。与许多其他Web服务不同，它们正在不断发展，并随着摄取越来越多的标记数据而不断改进。

这是机器学习与其他更熟悉的算法之间的重要区别。随着Microsoft改进其培训和模型，服务范围以及响应性和准确性不断提高。有些人甚至可以利用称为“转移学习”的过程，在该过程中训练具有一组数据的模型可以提高另一组数据的性能。

[ 也在InfoWorld上：深度学习与机器学习：理解差异 ]

持续改进并不是微软投入认知服务研究工作的唯一好处。认知服务使该研究可操作，并在研究从实验室转移到商业产品时提供新的工具和服务。此处重要的是预览和常规可用性之间的过渡，因为Azure和Microsoft Research共同努力进行纯粹的研究，并将其转变为可包含在应用程序中的工具。

微软已经能够对其一些认知服务进行容器化，以在Azure的Edge服务器和任何其他支持Docker的平台上使用。您可以在本地处理数据（而不是通过低带宽链接将数据推送到云），作为IoT Hub实例的一部分，仅将对其他应用程序或管理员重要的信息发送给其他应用程序或管理员。

表单识别器简介

当前正在预览的更有趣的新服务之一是Form Recognizer 。随着组织进行数字化转型，将纸质文档和表格引入新的业务流程非常重要。传统的扫描和光学字符识别在某种程度上使文档数字化，但是它们错过了表单的半结构性，无法扫描页面上的所有数据。

表单识别器采用更加细致的方法来处理表单数据，使用机器学习来解析表单的结构，然后提取信息。通过构建表单结构的模型，您可以使用该模型构建带有语义/标记的输出，其中包含键/值对和表，然后可以使用它们填充使用SQL或NoSQL文档数据库的结构化商店。您所需要的只是少量用作培训数据的表格，使您可以构建标记的数据集，该数据集可用于调整Form Recognizer模型以与您的文件一起使用。

由于Form Recognizer是一种API，您可以将其合并到新的和现有的业务流程中，从而替换手动数据捕获流程，同时标记可能需要人工干预的异常。您甚至可以将Form Recognizer与Power Platform工具（例如Power BI）结合使用，以从原本仅纸张的数据中提供业务见解。

[ 同样在InfoWorld上：Microsoft Azure云迁移：3个成功案例 ]

训练表单识别器模型

Form Recognizer有趣的方面之一是，基础模型使用无监督学习。无需标记训练数据。系统会识别表单元素并为您的表单数据生成适当的数据结构。尽管这是训练系统的简便方法，但您确实可以选择使用带标签的数据来获得更准确，更快的结果。

培训过程的关键要素是布局API。这为模型提供了用于表单布局的结构，并带有用于各个字段的标签。使用此表和带标签的培训表中的数据，您可以快速定义输出数据结构，并确保您的代码已准备好与服务一起使用。

构建带有标签的样本进行培训需要一个本地应用程序，该应用程序可以作为带有Web UI的Docker容器使用。您可以从Microsoft下载它，并在Windows，MacOS或Linux上运行容器（如果已安装Docker）。甚至还可以选择使用Azure Kubernetes服务（AKS）或在任何其他Kubernetes基础结构上运行容器。表单图像存储在Azure Blob中，本地识别器将对表单进行OCR，使它们准备好标记要使用Form Recognizer提取的各种表单元素。您只需要五六个样本表格即可训练模型。

接受培训后，您将拥有一个自定义的Form Recognizer模型，该模型具有其自己的模型ID和准确性得分。如果要改进模型，请添加更多示例数据。可以使用训练工具对尚未纳入训练集的文档进行测试，以测试生成的模型。您将看到源文档的视图，其中包含用于识别数据的边界框和每个元素的置信度。重要的是要注意，Form Recognizer不能使用所有表单元素。目前，不支持复选框或复杂表。

[ 也在InfoWorld上：2020年的人工智能预测 ]

在您的应用程序中使用Form Recognizer

围绕Form Recognizer构建应用程序相对容易。如果您不使用受支持的SDK使用的语言，则可以使用 REST API，该API 可以获取表单图像并提取数据。该服务当前支持最常见的图像格式：JPC，PNG，PDF和TIFF。

该API相对简单；它使用POST上传和分析表单内容，并使用GET返回结果。图像通过POST作为JSON对象的一部分或作为标准文件流发送。加载作业后，标准的HTTP 2020响应将返回将保存分析结果的结果ID。然后，您可以使用结果ID致电服务。如果已处理表单，则结果将在可解析的JSON对象中传递，并传递表单键/值对和任何结果表。

像所有认知服务一样，结果具有置信度。您可以使用它来指示某些表单以进行手动检查，或者将结果数据传递到您的业务应用程序中，以存储数据以备将来使用或使用它来驱动业务流程。

Form Recognizer的一个有用功能（显然是建立在Microsoft自己的费用系统要求之上的）是一种预先构建的模型，可与美国常见的收据格式一起使用。您可以使用它来捕获收据数据并将其馈送到您自己的费用工作流程中，使用手机摄像头随时随地捕获收据数据。工人将能够通过手机生成费用报告，而不必花费时间在Web表单中输入数据。 Form Recognizer工具将捕获必要的数据，并与用户信息和设备位置一起自动更新记录。

[ 通过InfoWorld Daily新闻通讯了解软件开发，云计算，数据分析和机器学习方面的最新发展 ]

Form Recognizer的入门相对简单，每个月最多可以有500个免费页面，因此您应该能够快速查看它是否适合您。一旦启动并运行，它应该在笔和纸与数字世界之间建立有用的桥梁，使用照片或扫描将表单内容快速引入您的业务流程。借助现代电话摄像头的质量及其对计算摄影的支持，可以使表单识别成为一个简单的插件，该插件可以拍摄照片并将其上传到识别器，并保存本地副本以供记录。

Form Recognizer是一种可以快速显示机器学习优势的工具，其模型旨在在相对封闭的领域中灵活地工作。将Azure的认知服务应用于特定的业务问题非常有意义。处理纸张到数字的过渡是长期以来一直阻碍改进业务流程的那些问题之一。对于大多数企业而言，使用机器学习来减少交付数字化所需的成本和时间是一个胜利，特别是如果这意味着我们可以在口袋中使用相机而不是昂贵的扫描仪和不可靠的OCR软件。