9.1 Uipath 对PDF的基本操作


一、安装PDF插件

在这里插入图片描述

二、准备PDF文档 (例1-4 Note.pdf, 例5 Invoice.pdf )

在这里插入图片描述
在这里插入图片描述

三、识别PDF所有文字和图像

1. 识别PDF文字: Read PDF txt
2. 识别PDF图像及文字: Read PDF with OCR 和Screen Scraping
3. 识别多个PDF中相同的单个字符 (Get Text 和Anchor Base)
例1:识别PDF文字
  1. 新建一个sequence
  2. 添加一个Read PDF txt的方法
    在这里插入图片描述

Range是指扫描的页数,跟word文档打印的Range是一样的功能。例如:“All”, “3-7”, ”1”
3. 添加一个write txt file输出方法和message box屏幕输出方法
在这里插入图片描述

  1. 运行结果如下:图片并未识别
    在这里插入图片描述
例2:识别PDF图像和文字方法一
  1. 添加Read PDF with OCR
    在这里插入图片描述

2.运行结果如下:图片和文字均可识别
在这里插入图片描述

Tips:OCR识别的准确度会随着PDF图像的清晰度而降低,尽量避免使用OCR识别方法。

例3:识别PDF图像和文字方法二
  1. 打开PDF文件,点击Screen Scraping
    在这里插入图片描述

  2. 保存录制结果,添加message box方法,接收 “MicrosoftedgeExeMicro” 变量
    在这里插入图片描述

  3. 运行结果如下
    在这里插入图片描述

例4:识别多个Notes.pdf中相同的 ”IMPORTANT READ:”
  1. 打开Notes.pdf,加入getText方法
    在这里插入图片描述

  2. 添加message box方法
    在这里插入图片描述

  3. 运行结果如下
    在这里插入图片描述

  4. 去掉title (可匹配多个PDF文档) 和 text (用index来代替字符串)

  5. 接着打开Note2.pdf文档,点击运行按钮,测试结果仍然是 ”IMPORTANT READ:”,Selector选择器的情况如下
    在这里插入图片描述
    在这里插入图片描述

例5:使用Anchor Base锚点测试多个Invoice文件

1.打开Invoice1.pdf文件,添加一个Anchor Base,锚点里有两个参数,一是找到需要测试的对象名称,二是得到要测试对象的值
在这里插入图片描述

  1. find element方法(或find image方法 )中的selectors修改如下
    在这里插入图片描述

  2. get text方法中的selectors修改如下
    在这里插入图片描述

  3. 分别测试Invoice1.pdf和Invoice2.pdf文件,测试结果请自行验证
    Tips:若使用find image方法,先将PDF设置为实际大小(我使用find image方法测试不成功)

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天地无名

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值