Python爬虫实现百度图片自动下载

最新推荐文章于 2024-06-18 10:52:11 发布

WUNEAL

最新推荐文章于 2024-06-18 10:52:11 发布

阅读量490

点赞数 1

文章标签： python 正则表达式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WUNEAL/article/details/119647785

版权

本文介绍了如何使用Python编写爬虫从百度图片自动下载图片。通过分析网页源代码，结合开发者工具找到清晰图片的objURL，利用正则表达式提取图片链接，并使用requests库下载图片，最终将图片保存到本地的images目录中。

摘要由CSDN通过智能技术生成

制作一个爬虫一般分以下几个步骤：
1、分析需求
2、分析网页源代码，配合开发者工具
3、编写正则表达式或者XPath表达式
4、正式编写 python 爬虫代码

运行效果如下：
效果预览

存放图片的文件夹：
在这里插入图片描述

需求分析

我们的爬虫至少要实现两个功能：一是搜索图片，二是自动下载。
搜索图片：最容易想到的是爬百度图片的结果，我们就上百度图片看看：
在这里插入图片描述

随便搜索几个关键字，可以看到已经搜索出来很多张图片：
在这里插入图片描述

分析网页
我们点击右键，查看源代码：
在这里插入图片描述

打开源代码之后，发现一堆源代码比较难找出我们想要的资源。
这个时候，就要用开发者工具！我们回到上一页面，调出开发者工具，我们需要用的是左上角那个东西：(鼠标跟随)。
在这里插入图片描述

然后选择你想看源代码的地方，就可以发现，下面的代码区自动定位到了相应的位置。如下图：
在这里插入图片描述

我们复制这个地址，然后到刚才的一堆源代码里搜索一下，发现了它的位置，但是这里我们又疑惑了，这个图片有这么多地址，到底用哪个呢？我们可以看到有thumbURL，middleURL，hoverURL，objURL
在这里插入图片描述

通过分析可以知道，前面两个是缩小的版本，hoverURL 是鼠标移动过后显示的版本，objURL 应该是我们需要的，可以分别打开这几个网址看看，发现 objURL 的那个最大最清晰。
找到了图片地址，接下来我们分析源代码。看看是不是所有的 objURL 都是图片。
在这里插入图片描述

发现都是以.jpg格式结尾的图片。

编写正则表达式

Python 正则表达re模块之findall()详解

pic_url = re<

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫实现百度图片自动下载

制作一个爬虫一般分以下几个步骤：1、分析需求2、分析网页源代码，配合开发者工具3、编写正则表达式或者XPath表达式4、正式编写 python 爬虫代码运行效果如下：存放图片的文件夹：需求分析我们的爬虫至少要实现两个功能：一是搜索图片，二是自动下载。搜索图片：最容易想到的是爬百度图片的结果，我们就上百度图片看看：随便搜索几个关键字，可以看到已经搜索出来很多张图片：分析网页我们点击右键，查看源代码：打开源代码之后，发现一堆源代码比较难找出我们想要的资源。这个时候，就要用开
复制链接

扫一扫

WUNEAL CSDN认证博客专家 CSDN认证企业博客

码龄5年

35: 原创

11万+: 周排名

3万+: 总排名

5万+: 访问

: 等级

766: 积分

210: 粉丝

311: 获赞

22: 评论

346: 收藏

私信

关注

热门文章

最新评论

Android adb启动任意app的几种方式
穷苦书生_万事愁: 博主的这篇文章真是让我大开眼界，对于Android adb启动任意app的几种方式这个话题，我以前只是略有了解，但是通过博主的详细介绍和细致的分析，我对这个主题有了全新的认识。博主的文字表达清晰流畅，细节描写非常到位，让我感受到了博主的深厚功底。期待博主未来能够持续分享更多好文，同时也希望能够得到博主的指导，共同进步。非常感谢博主的分享和支持！
锂原电池实际容量测试之ER18505M
jay学习进修班: 加个微信，我们有电池选型需求。
锂原电池实际容量测试之ER18505M
WUNEAL: 可以这样评估：因该款电池在我司设备上使用的截止电压为2.8V，故以电池标称电压3.0V——截止电压2.8V的放电容量为实际使用容量值。放电电流参照设备长期运行的平均电流，如设备平均工作电流为1mA左右，可以使用放电仪1mA电流对电池进行放电，记录电压跌落至2.8V所放出的容量。
锂原电池实际容量测试之ER18505M
jay学习进修班: 实际使用时，电压2.8V设备就没法工作了，也放不到2.0V，如何评估实际的容量值。
锂原电池实际容量测试之ER18505M
CSDN-Ada助手: 恭喜您发布了新的博客！看到您对锂原电池实际容量的测试，我感到非常兴奋。您的实验数据和结论无疑对大家了解电池性能有很大帮助。希望您能继续坚持创作，分享更多有价值的内容。或许下一步可以考虑展开不同型号电池的比较测试，这样可以更全面地了解不同电池的性能差异。期待您的下一篇作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。