Python爬取图片

程序员云养猫

于 2024-04-26 14:53:57 发布

阅读量171

点赞数 3

分类专栏：程序员文章标签： python 开发语言

本文链接：https://blog.csdn.net/m0_60635176/article/details/138218967

版权

程序员专栏收录该内容

182 篇文章 0 订阅

订阅专栏

def getImage():

# 将index置为全局变量

global index

# 循环爬取，循环多少次爬取多少页的图片

for i in range(0,50):

    # 模拟点击下一页，因为爬取完一页需要点击下一页爬取

    driver.find_element_by_link_text("下一页").click()

    # 解析网页

    html = BeautifulSoup(driver.page_source, 'html.parser')

    # 获取原图的url链接

    links =html.find('div', {'class': 'slist'}).find_all('img')

    # 遍历当页获得的所有原图链接

    for link in links:

        # 将原图存至当前目录下的jdimg 文件夹，以index命名，后缀名为图片原名的后三位，即jpg或者gif

        with open('baidu8/{}.{}'.format(index, link.get('src')[len(link.get('src'))-3: len(link.get('src'))]), 'wb') as jpg:

            jpg.write(requests.get("http://pic.netbian.com/" + link.get('src')).content)

        print("正在爬取第%s张图片" % index)

        index += 1

定义主函数

def main():

getImage()

main()




我们用记事本将此脚本写入，然后修改后缀名为py，然后在同级目录下创建一个文件夹用来存储图片，代码里的文件夹必须提前创建好，不然运行报错找不到文件夹，如图  

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210208233905704.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDA5NjEzMw==,size_16,color_FFFFFF,t_70)  

我这里的文件夹就是用来存储图片的，已经存的满满当当  

**运行脚本**  

我们cmd进入命令行例如我这里就进入到d盘的test文件夹下，如图  

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210208234203116.png)  

我们输入py baidu.py来运行我们的脚本，前提我们配置好了环境变量，所以可以在任意位置运行python脚本，最后效果如图  

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210208234722810.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDA5NjEzMw==,size_16,color_FFFFFF,t_70)  

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210208235834412.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDA5NjEzMw==,size_16,color_FFFFFF,t_70)  

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210209000630219.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDA5NjEzMw==,size_16,color_FFFFFF,t_70)



**总结**  

技术是把双刃剑，希望大家合理运用技术，下一次分享爬取小视频的内容，最后说一句，老铁早点睡啊。



 



[



![](https://img-blog.csdnimg.cn/92aabf6b0d3144eaa7da7155d56e35de.jpeg)



开发者涨薪指南 ![](https://img-blog.csdnimg.cn/img_convert/b5fcf6e09c46b6f1ab10924e0d6dbf04.png)



48位大咖的思考法则、工作方式、逻辑体系







### 最后

> **🍅 硬核资料**：关注即可领取PPT模板、简历模板、行业经典书籍PDF。  
> **🍅 技术互助**：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。  
> **🍅 面试题库**：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。  
> **🍅 知识体系**：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。




**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**
ics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

程序员云养猫

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬取图片

getImage()main()我们用记事本将此脚本写入，然后修改后缀名为py，然后在同级目录下创建一个文件夹用来存储图片，代码里的文件夹必须提前创建好，不然运行报错找不到文件夹，如图![在这里插入图片描述](https://img-blog.csdnimg.cn/20210208233905704.png?我这里的文件夹就是用来存储图片的，已经存的满满当当**运行脚本**我们cmd进入命令行例如我这里就进入到d盘的test文件夹下，如图!
复制链接

扫一扫