Python爬取全站妹子图片，差点硬盘走火了！

最新推荐文章于 2022-02-24 13:11:36 发布

IT白鸽

最新推荐文章于 2022-02-24 13:11:36 发布

阅读量520

点赞数

文章标签： Python Python3 Python爬虫网络爬虫数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45523154/article/details/103002599

版权

在这严寒的冬日，为了点燃我们的热情给大家带来了偷偷收藏了很久的好东西。大家要注意点哈，自己操作的时候别走火！

1.所需库安装

2.网站分析

首先打开妹子图的官网（mzitu.com），点击菜单(最新)，经过观察(最新)发现是按时间来排序的，也就是网站全部的组图按发布时间来排序的，页面链接为mzitu.com/page/1, mzitu.com/page/2最后面的数字递增，所以将(最新)的图片全部爬取就大功告成！

3.构造请求头

在进行初次爬取碰到钉子后，我发现在请求头中要有referer才能获取图片，下面为请求头的构造。

4.下载图片

5.获取一组组图里面的所有图片页面链接

6.使用多进程下载整页的所有图片

7.下载全站所有图片

运行结果：

以上就是代码与运行过程，对Python感兴趣或者是正在学习的小伙伴，可以加入我们的Python学习扣qun：784758214，从0基础的python脚本到web开发、爬虫、django、数据挖掘数据分析等，0基础到项目实战的资料都有整理。送给每一位python的小伙伴！每晚分享一些学习的方法和需要注意的小细节，电子书籍整理打包赠送！快点击加入我们的 python学习者聚集地

哎呀！不行了，我得用冷水冷静冷静！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。