堆糖网 爬取图片

堆糖是一个很有生活情调的网站,上面有很多好看的图片有意思的分享,作为一个资深菜鸟今天,分享一小段代码爬取堆糖上的好看图片~分享思路给初学者~

前几天刚学爬虫的时候就迫不及待的复制网址然后粘贴进requests.get()里试图得到成千上万的好看图片,然后现实很尴尬,我只能得到24张图片!并且修改了网址之后,也就是添加了page=2 page=3之后,下载到的依然是第一页的24张图,第二页之后下不到!菜鸡的我直接傻掉了。。

几天之后我又打开了这里开始分析:


因为今天是万圣节,所以搜索关键字kw设置成了万圣节~然后有个参数start=24,似乎和我下载下来的图片数量一致!别的参数看不懂!然后继续下拉网页...



似乎发现了什么..然后翻页之后发现变化的依然只有start的值,每次刷新增加24,以及最下面那个参数每次加1(我不知道是什么),这里并没关于page的参数。由此我们可以构造URL试试看!

测试了一下请求成功!那剩下的就简单了。简单分析一下得到的json字符串就可以找到图片的URL了,在photo里面:


这里是提取图片URL并下载的(我写的渣)代码(然后宅男们就可以...):

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值