【爬虫】堆糖图片爬取

最新推荐文章于 2022-09-20 12:50:49 发布

Mole-09

最新推荐文章于 2022-09-20 12:50:49 发布

阅读量2.9k

点赞数 11

分类专栏：爬虫文章标签：爬虫图片下载练习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40874586/article/details/83277160

版权

堆糖上面的图片一直是我打算爬一下的，但说着说着就忘了这么一回事-_-||

今天正好想起来，就麻利儿的把这件事给搞定了。

话不多说，先上成果。

接着说思路，代码在最后面。

最开始，我以为堆糖是那种一页一页显示图片的，就下意识地按照其他方法去爬了，结果写完才发现堆糖的结果显示是需要下拉刷新的，所以这里就有两份不同的代码。

为了以后自己查看自己的文章方便，这里就不记述静态爬取的过程了。

在这里，我以“古风”关键词为例，把爬虫的过程解释一下。

一.分析url

因为已经知道是动态拉取的，所以直接在堆糖的搜索界面上右键—查看元素—网络—XHR，停在这个页面后，就下拉鼠标，直到新一页加载出来，此时我们可以获得一条新请求。

将消息头里的请求网址粘贴到记事本。继续下拉，查看其它请求网址。

分析了一下请求网址，可以看出，每次不同的地方就在最后的两个&处。

其中第一个start=，我们可以认为是每次请求后已获得的图片的数量，而后面的那个，我也不知道是什么.....

但可以看出，每次请求，它的值都是加一的。

把第一个请求网址在浏览器打开，可以看到浏览器自动以json文件打开。

在这张截图里，我们正好可以看到三条链接，而且三条链接都是不同属性。

分析一下，这里的0，应该是指保存到的专辑封面。

avatar：阿凡达，化身。也就是用户的头像（顺便

最低0.47元/天解锁文章

关注

11
点赞
踩
16

收藏

觉得还不错? 一键收藏
4
评论
【爬虫】堆糖图片爬取

堆糖上面的图片一直是我打算爬一下的，但说着说着就忘了这么一回事-_-||今天正好想起来，就麻利儿的把这件事给搞定了。话不多说，先上成果。接着说思路，代码在最后面。最开始，我以为堆糖是那种一页一页显示图片的，就下意识地按照其他方法去爬了，结果写完才发现堆糖的结果显示是需要下拉刷新的，所以这里就有两份不同的代码。为了以后自己查看自己的文章方便，这里就不记述静态爬取的过...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。