【云扩RPA】getInfo

在这里插入图片描述

完整的 RPA 流程包括的模块(下)

流程概述

如上节课所说:一个完整的流程一般包括“日志创建”、“环境初始化”、“主业务数据处理”及“结束处理”等模块。其中上节课我们探讨了如何进行日志创建与初始化环境。这节课我们来探讨“主业务数据处理”与“结束处理”及主数据处理的稳定性问题。在实际项目中,流程的稳定性/健壮性是最需要关注的部分,因为这是一个流程价值体现的最最重要的一个环节。一般情况下,我们会使用大量的错误捕获组件提升流程的健壮性。

我们以在企查查网站查询企业信息并保存到 Excel 文档作为演示内容。流程示意图如下:

首先,将需要查询信息的企业名称及所要查询的企业信息title保存在Excel文件中,如下图(可根据自己的真实需求来保存企业信息):

流程开发步骤

添加流程图

打开云扩编辑器,选择“流程模板”项目(接上节课项目)并打开,拖入“流程图”组件并重命名。

读取 Excel 文件中的企业信息

打开 Excel 文件。

获取末行号作为循环次数。

打开企查查

循环查询

建立循环:以单元格索引为递增变量,从第2行开始递增,循环至单元格索引和Excel最大行数相等。

添加错误捕获组件

在企查查网站上查询信息时,我们经常会遇到一些问题,导致组件会抛出异常,循环停止,流程无法继续查询下一个企业信息。这些问题可能是:

  • 网页不稳定;
  • 需要查询的企业不存在;
  • 其中某一个字段不存在。

在项目中,我们需要捕获异常信息并做相应的处理,然后进行处理下一条数据的正常查询。这时**错误捕获(Try Catch)**组件就可以发挥它的作用。

在本例中,我们将获取企业信息部分作为 Try 的内容,在 Catch 中处理异常,在 Finally 中添加一个循环完成后必须要做的部分。

在 Try 中写入正常业务流程

使用 读取单元格 组件,以读取企业信息。

使用拼接查询结果 url 的方式,访问查询结果页面。

点击访问企业信息。

编辑点击组件。这个组件应用在循环中。因此,我们需要对该组件的选择器进行编辑,使用通配符替代企业名称,使在不同关键词的搜索结果页上都能够完成点击操作。

在上面的视频中,我们除了将 Window8 的 Name 中企业名称改为通配符,还将 WebElement 中的Sinfo* 改为 XPath。实际达成的效果是一致的。实际项目中使用何种修改方式只为实际的稳定性进行选择。实际交付时,我们也经常需要在获取的 XPath 内容上进行修改。

检查页面中的企业信息是否为 table 元素。如果是,我们可以拖入获取结构化数据组件一次性获取所有需要的企业信息;如果不是,那么可以用获取文本组件来逐个获取。此处,我们发现是 table 元素。

使用获取结构化数据组件,获取信息。

将数据写入到 Excel 文件中。写入时,确认字段正确。


获取的有些数据因为含有脏数据,还需进行额外处理。我们使用 确认框写入日志 提供额外检查。脏数据处理时,用到两个字符串处理函数,请自行查阅资料了解使用细节:

- `Split()`
- `Trim()`

关闭当前企业信息页面。

在 Catch 中写入异常处理逻辑

常用的异常处理手段有:

  1. 写入文件组件来记录异常,方便后续查询异常原因。
  2. 如果因为网络问题导致网页上数据没有正确显示,可以用刷新浏览器组件进行刷新,甚至可以重新进行环境初始化.
  3. 如果需要获取的某一个字段有可能会出现异常(字段不存在等),也可以对该字段用Try Catch方法进行针对性处理。

以下以写入文件为例:

在 finally 中进行单元格索引递增

通过单元格索引递增,获取下一条数据。

编制流程时,参考以下视频:

在 finally 中进行单元格索引递增

通过单元格索引递增,获取下一条数据。

[外链图片转存中…(img-CrLcpjwk-1607227531735)]

编制流程时,参考以下视频:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值