用蓝印RPA遍历网页中的相似元素并抓取内容

本文介绍了如何使用蓝印RPA工具在百度首页上通过for循环遍历相似元素,利用XPath提取热搜标签的文字内容,以实现高效的数据采集。
摘要由CSDN通过智能技术生成

用RPA采集数据时,需要经常对多个相似元素的内容进行采集。这里教大家如何用蓝印RPA实现遍历网页中的相似元素并采集相关内容。

这里以采集百度首页上的热搜标签为例:

流程逻辑:1、访问百度首页->2、生成热搜标签页的xpath路径->3、获取相似元素个数->4、通过For循环来遍历每个元素->5、在for循环流程里获取标签页的文字内容

流程步骤如下:

1、添加加载url流程,填入要采集内容的网址

2、获取相似元素个数

3、通过for循环来遍历各个标签页

4、在for循环流程里获取当前热搜标签的内容,这里使用“通过xpath获取属性值”的流程步骤来获取innerText的内容

设置完流程后点击运行,数据就采集到啦,这里我们只对标题进行日志输出打印。从上面的窗口上我们可以看到内容已经都采集到了。蓝印RPA使用简单,仅仅3个流程就能实现对多个相似的元素进行内容采集。

更多使用教程请到蓝印RPA官网下载了解,还有丰富的帮助文档提供帮助

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值