看腻了杨幂,热巴,快来抓取上千张美女图片,古装美女看个够

大家好,我是菜鸟哥!

最近的一段时间以来,小编都没有为大家送上一些小姐姐福利,今天小编就带领大家来抓取古装小姐姐的美照,通过程序来抓取上千张古装美女的图片,一起来看看吧。

01.程序讲解

对于古装美女数据的抓取,程序获取的是靓丽图库(https://www.hexuexiao.cn/meinv/guzhuang/)的图片数据,如下图所示:

网站中不仅有古装美女的图片,而且还有日韩美女、动漫美女等美图,通过今天程序的分享,大家可以通过程序的修改来抓取其他类型的图片。

对于图片的抓取,程序可以分为三个部分来进行拆解。

  • 获取子网页链接

  • 获取每张图片的链接

  • 抓取图片保存到本地  

    为了便于大家对于程序的理解,上述的三个部分,程序分别利用了三个函数来对应实现。

02.获取子网页链接

通过对于网页的分析,可以发现我们要抓取的网页属于静态网页,也就是说我们想要获取的子网页链接,就通过对于网页源代码的解析就能够获取得到。

如上图所示,网页源代码中,包含着网页中的文本信息,还有我们想要抓取的子网页的链接地址。根据这些信息,我们就可以利用requests库来请求网页源代码,通过BeautifulSoup、Xpath等库来进行网页源代码的解析,并提取出我们想要的子网页链接地址。

对于程序的编写,完全按照我们上述的分析来完成,首先是对于网页源代码数据的获取,并通过BeautifulSoup来解析网页源代码并获取得到所有的子网页链接。程序中的每行程序小编都进行了注释,方便大家对于程序的理解。

03.获取每张图片的链接

对于每张图片的链接,这里同样是对于静态网页的解析。同子网页抓取稍微不同的是,程序需要判断每个子网页中,包含多少张图片,程序如下图所示。

程序中添加了对于每个子网页下包含多少张图片的判断,因为每个子网页下的每张图片有不同的网页链接,例如对于https://www.hexuexiao.cn/a/124672-0.html和网页https://www.hexuexiao.cn/a/124672-1.html来说,是针对于子网页https://www.hexuexiao.cn/a/124672.html衍生出来的两张图片的链接地址。在获取得到每张图片的链接地址后,程序按照静态网页的分析方法来获取每张图片的链接,并通过self.savePic函数保存图片。

04.抓取图片保存到本地  

图片数据的保存,可以通过下图中的三行程序进行完成。

程序请求网页图片的数据,通过二进制写入的方式,将图片保存到本地文件,进行保存。

05.结果展示

以上三个部分的解析,便是我们所有的程序内容,接下来我们来看一下抓取得到的结果吧。

06.总结

通过程序的抓取,一共获取到了上千张古装美女的图片,一共包含了200多位古装模特,图片质量非常棒,大家可以用来制作壁纸,如果大家还觉得不够的话,可以通过对于程序的修改,来下载其他类型的图片数据。

欢迎大家在留言区吱一声,记得给个三连哦!

需要源码的同学,请在公众号后台输入:小助手,备注暗号:(古装美女)

推荐阅读:入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影年度爆款文案1).卧槽!Pdf转Word用Python轻松搞定!2).学Python真香!我用100行代码做了个网站,帮人PS旅行图片,赚个鸡腿吃3).首播过亿,火爆全网,我分析了《乘风破浪的姐姐》,发现了这些秘密 4).80行代码!用Python做一个哆来A梦分身 5).你必须掌握的20个python代码,短小精悍,用处无穷 6).30个Python奇淫技巧集 7).我总结的80页《菜鸟学Python精选干货.pdf》,都是干货 8).再见Python!我要学Go了!2500字深度分析!9).发现一个舔狗福利!这个Python爬虫神器太爽了,自动下载妹子图片
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值