八爪鱼爬取数据细节（比如循环翻页和循环列表的方式和提取数据的方式--自定义）

最新推荐文章于 2024-04-05 23:38:40 发布

没有梦想何必远方。

最新推荐文章于 2024-04-05 23:38:40 发布

阅读量1.9w

点赞数 1

分类专栏：八爪鱼

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41799291/article/details/91195811

版权

八爪鱼专栏收录该内容

4 篇文章

订阅专栏

1.网址 http://edu.bjstats.gov.cn/tjsj/yjdsj/xxzs/2011/
2.需求：循环点击页面超链接循环列表爬取指定数据：
3.八爪鱼流程：
1.打开网页：
在这里插入图片描述
2.要么循环点击超链接，要么循环翻页，注意：选中不固定元素，利用火狐插件选出循环列表或者循环下一页：

3.点击元素：进入到超链接里面，设置好应有的条件，如果点击超链接是打开一个新标签，那么就要在点击元素里面把在新标签中打开页面勾选上，不然会有问题。
在这里插入图片描述
4.循环列表: 要采集的页面肯定有一个列表，table tr td ,也选择不固定元素通过火狐浏览器把相应的XPATH 写入八爪鱼，

5.提取数据：自定义提取数据的字段，一把数据都在列表也就是tr/td中也可根据火狐浏览器获取在这里插入图片描述
6.开始采集

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。