RPA开发教程丨RPA+OCR如何提取电子合同信息

本文介绍了如何使用RPA工具UiBot结合OCR技术自动化提取电子合同的关键信息,包括Word和PDF两类文件的处理方法。Word类合同通过字符规则提取,PDF类合同则分为文字型和图片型,图片型需要OCR识别并人工校验。虽然PDF图片类的自动化效果受限,但整体流程自动化仍能显著减轻业务人员的工作负担。
摘要由CSDN通过智能技术生成

随着公司产品UiBot的影响力在国内外不断增强,与合作伙伴签订的合同也变得越来越多,故此导致业务人员对合同关键信息的提取工作,变得日益繁重。

基于此,公司内部关于电子合同信息提取的流程自动化需求应运而生。

以下是关于RPA+OCR提取电子合同信息的流程视图。

RPA+OCR提取电子合同信息流程视图

基于电子合同信息的提取,根据文件类型,分为两大类:Word和PDF。

**1、Word类。**Word类的会直接用RPA机器人UiBot从信息里面根据字符规则提取出关键信息,生成结构化数据,当然,也会遇见有些Word文档是补充协议等,没有相关要提取的信息,这类会根据业务规则直接在流程里面,根据模板判断划分出来。

**2、PDF类。**PDF类的会根据里面信息分为两类,一类是文字型,一类是图片型。

文字的可以使用UiBot的窗口元素中的预制组件获取元素文本或者文本中的获取文本来提取关键信息。(需要注意的是使用Acrobat的时候,需要在编辑中选择辅助工具来做如下图操作)

Acrobat更改当前文档的阅读选项

图片类的,就必须要使用OCR来进行识别,然后进行信息提取,因为上面有盖章等不同因素的影响,正确率并不能保证百分之百,甚至也没有关键性可以回流验证的信息,所以生成的结构化数据仍需要人工二次校验,才可以录入系统

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值