使用rpa打开浏览器并执行js抓取页面元素详情步骤

最新推荐文章于 2024-01-26 15:55:46 发布

一方_self

最新推荐文章于 2024-01-26 15:55:46 发布

阅读量598

点赞数

分类专栏： rpa 文章标签： javascript rpa 前端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/f2424004764/article/details/135819695

版权

rpa 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

掘金的文章也是我写的，就复制过来了。

这里我们专门开一个文章来写如何在rpa中执行js获取页面元素。

个人觉得，复杂点的需求用js会方便很多，所以后续的文章我都会重点使用js去获取页面元素。

好，正文开始，我们先看一下rpa为我们提供的自带的方便的抓取元素的方式，我们还是以小红书为例，还是以上一个例子为例，上个例子我们使用执行js的方式获取用户列表，这次我们新建一个流程：

使用自带的抓取方式作为对比，我们点击编辑->数据抓取：

点击选择目标：

这里局限性就来了，还选中了认证的图标，到时候我们看看输出的是什么。

提示我们需要再抓一下同样层级的元素：

我们选择第二个用户的名称：

然后就抓到数据了：

我们调试一下：

数据有了：

我们看看rpa的源码，可能不够直观吧，要是下次要改的话，都不知从何下手，还得重新选取。

所以这里如果你的需求只是简单获取列表数据，且并不会二次修改，那么就用自带的选取方式，但如果你需要更精准的数据获取方式，则推荐直接使用运行js的方式获取。

所以这里我们重点讲解下运行js的方式来精准的抓取数据。

在rpa中有提供一个执行js的方法：

可以设置是否同步执行以及js执行出错时是否还能往下执行等。

我们一般获取数据时都是使用同步js，使用默认配置即可，我们还是用小红书举例，我们这次获取小红书作者信息：

我们这里来获取这个小红书作者的昵称、小红书号、关注数、粉丝数、获赞数这五个数据。

我们先在浏览器中写js代码尝试获取，没问题再复制到rpa中。

我们按下f12，切换到console，并清空控制台：

用浏览器自带的工具确定下要抓取的元素：

为class为info-part的div，第一步先拿到整体块的元素：

我们再精细化到下一级元素：

再确定一下需要抓取的元素在那个div下：

我们先从昵称和小红书号开始：

昵称的div是：

js：

拿到了昵称，再是小红书号：

注意标签是span了，replace函数将【小红书：】删除，只保留账号。

接下来是关注数和粉丝数以及点赞数，我就一起获取了，先看看结构：

可以看到三个值所在的大的div叫user-interactions，该div下还有三个小div，就是存放三个数值的地方了：

我们直接用下标的方式取：

最后我们用一个函数返回这些五个字段：

结果：

这篇文章就到这里啦！如果你对文章内容有疑问或想要深入讨论，欢迎在评论区留言，我会尽力回答。同时，如果你觉得这篇文章对你有帮助，不妨点个赞并分享给其他同学，让更多人受益。

想要了解更多相关知识，可以查看我以往的文章，其中有许多精彩内容。记得关注我，获取及时更新，我们可以一起学习、讨论技术，共同进步。

感谢你的阅读与支持，期待在未来的文章中与你再次相遇！

作者：一方_self
链接：https://juejin.cn/spost/7327353616380903451
来源：稀土掘金
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
使用rpa打开浏览器并执行js抓取页面元素详情步骤

所以这里如果你的需求只是简单获取列表数据，且并不会二次修改，那么就用自带的选取方式，但如果你需要更精准的数据获取方式，则推荐直接使用运行js的方式获取。记得关注我，获取及时更新，我们可以一起学习、讨论技术，共同进步。个人觉得，复杂点的需求用js会方便很多，所以后续的文章我都会重点使用js去获取页面元素。我们看看rpa的源码，可能不够直观吧，要是下次要改的话，都不知从何下手，还得重新选取。这里局限性就来了，还选中了认证的图标，到时候我们看看输出的是什么。所以这里我们重点讲解下运行js的方式来精准的抓取数据。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一方_self 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。