python爬虫翻页_python爬虫翻页方式（一）修改请求url

最新推荐文章于 2023-03-06 15:35:56 发布

weixin_39722196

最新推荐文章于 2023-03-06 15:35:56 发布

阅读量3k

点赞数 3

文章标签： python爬虫翻页

u=3473337253,107559172&fm=173&s=C1B71D728BA04C0B4CE191CE000030B1&w=640&h=344&img.JPEG

python爬虫翻页不会了？

很多初学python爬虫的小伙伴们都会遇到python爬虫翻页的问题，我在这里先介绍一种。实践出真知，前几天有朋友说她（女性朋友，没想到吧）的导师让她整理一份资料。她便让我帮她整理一下那些资料。在写爬虫的过程中，我也遇到了翻页的问题。

需要爬取的网站如图所示

u=348743525,816105925&fm=173&s=ADD8E013939841C856CD254A0100A0B2&w=640&h=324&img.JPEG

查询的这种植物有四页。当我们平时翻页时，首先想到肯定是点击页面上的下一页，写爬虫也是如此，想提取页面上的链接进行访问。

不过我告诉你，这样做很麻烦，并且效率很低。没人用！！！

翻页的方式一般有两种：

1、观察网站翻页时链接变化

2、如果写爬虫的请求方式是post方式请求，则需要观察post的数据的变化是否有规律

今天讲得是第一种方法

如图，当我点击下一页时，观察到地址栏的链接变化

u=1872301172,998462033&fm=173&w=640&h=57&img.JPEG

在链接中我们可以惊喜的发现，有page关键字，而且恰好为2，我们试验一下，将链接中page的值改为3，发现正常访问，正好是第三页。因此，我们找到了翻页方式，更改链接中关键字的值。

因此翻页过程步骤为：

1、获取总网页数目

2、利用for循环改变page的值，进行翻页。

具体翻页代码实现如下：

u=684995343,3570905460&fm=173&s=A0C2B74012B6B26E4C554C0D0000E0C0&w=635&h=567&img.JPEG 获取总页码

u=774245192,1458764931&fm=173&app=25&f=JPEG?w=640&h=443&s=A0C2B34ADAACA76C4C798C0F0000E0C2 网络请求方式

u=4253436233,1920751014&fm=173&app=25&f=JPEG?w=461&h=148&s=A8C2B34A8FE4BD7054592C020000F0C2 翻页代码，改变请求头中的page数值

想要获取所有代码的可以私信我，大家共同学习。

码字不容易，大家多关照。

weixin_39722196

关注

3
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。