9.1 Uipath 对PDF的基本操作

天地无名

于 2022-04-21 10:22:38 发布

阅读量1.7k

点赞数 1

分类专栏： uipath 文章标签： uipath

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48233248/article/details/124003727

版权

uipath 专栏收录该内容

82 篇文章 62 订阅

订阅专栏

Uipath 对PDF的基本操作

一、安装PDF插件

在这里插入图片描述

二、准备PDF文档 (例1-4 Note.pdf, 例5 Invoice.pdf )

在这里插入图片描述

三、识别PDF所有文字和图像

1. 识别PDF文字: Read PDF txt

2. 识别PDF图像及文字: Read PDF with OCR 和Screen Scraping

3. 识别多个PDF中相同的单个字符 (Get Text 和Anchor Base)

例1：识别PDF文字

新建一个sequence
添加一个Read PDF txt的方法

Range是指扫描的页数，跟word文档打印的Range是一样的功能。例如：“All”, “3-7”, ”1”
3. 添加一个write txt file输出方法和message box屏幕输出方法
在这里插入图片描述

运行结果如下：图片并未识别

例2：识别PDF图像和文字方法一

添加Read PDF with OCR

2.运行结果如下：图片和文字均可识别
在这里插入图片描述

Tips：OCR识别的准确度会随着PDF图像的清晰度而降低，尽量避免使用OCR识别方法。

例3：识别PDF图像和文字方法二

打开PDF文件，点击Screen Scraping
保存录制结果，添加message box方法，接收 “MicrosoftedgeExeMicro” 变量
运行结果如下

例4：识别多个Notes.pdf中相同的 ”IMPORTANT READ:”

打开Notes.pdf，加入getText方法
添加message box方法
运行结果如下
去掉title (可匹配多个PDF文档) 和 text (用index来代替字符串)
接着打开Note2.pdf文档，点击运行按钮，测试结果仍然是 ”IMPORTANT READ:”，Selector选择器的情况如下

例5：使用Anchor Base锚点测试多个Invoice文件

1.打开Invoice1.pdf文件，添加一个Anchor Base，锚点里有两个参数，一是找到需要测试的对象名称，二是得到要测试对象的值
在这里插入图片描述

find element方法(或find image方法 )中的selectors修改如下
get text方法中的selectors修改如下
分别测试Invoice1.pdf和Invoice2.pdf文件，测试结果请自行验证
Tips：若使用find image方法，先将PDF设置为实际大小(我使用find image方法测试不成功)

在这里插入图片描述

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

天地无名 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。