python爬图片并按标题保存_python入门012～使用requests爬取网络图片并保存到本地...

最新推荐文章于 2024-05-02 22:12:06 发布

weixin_39610759

最新推荐文章于 2024-05-02 22:12:06 发布

阅读量221

点赞数

文章标签： python爬图片并按标题保存

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39610759/article/details/111440992

版权

上一节我们学习了python3借助requests类库爬取网页数据，这一节我们继续深入的讲解python爬虫的实现。今天要将的是使用python3爬取网络图片，并保存到本地。

本节知识点

1，python3爬取网站源码

2，正则匹配获取图片链接

3，使用python3将不怕保存到本地

一，首先我们来看下要爬取的网址

下图箭头所指的就是我们要爬取的图片。

二，爬取网址源码到本地

通过上图我们可以看到，我们成功的爬取到了网站源码，而这个网站的

三，正则表达式匹配图片链接

通过上图可以看出，我们成功的匹配到了网站源码里的图片链接，接下来，我们就要把这个图片保存在本地了。

四，保存图片到本地

如上图，我们做保存图片的时候，需要先在我们代码的外层目录创建一个 imgs文件夹，用于存放图片。然后编写核心代码。

五，完整代码如下。

六，运行代码，看下效果

可以看下我们爬取到的图片

最后把完整代码贴给大家

# python3爬取网络图片

import requests

import re

# 第一个爬取网址

url = 'http://www.nipic.com/photo/jingguan/ziran/index.html'

# 获得网页源码

data = requests.get(url).text

# print("网站源码", data)

# 图片正则表达式

regex = r'data-class="lazyload" src="https://img-blog.csdnimg.cn/2022010623195428710.png" data-original="(.*?.jpg)"'

# re是一个列表

pa = re.compile(regex) # 创建一个pa模板，使其符合匹配的网址

ma = re.findall(pa, data) # findall 方法找到data中所有的符合pa的对象，添加到re中并返回

# print(ma)

# 将ma中图片网址依次提取出来

i = 0

for image in ma:

i += 1

image = requests.get(image).content

print(str(i) + '.jpg 正在保存。。。')

with open('../imgs/' + str(i) + '.jpg', 'wb') as f: # 注意打开的是就jpg文件

f.write(image)

print('保存完毕')

weixin_39610759

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬图片并按标题保存_python入门012～使用requests爬取网络图片并保存到本地...

上一节我们学习了python3借助requests类库爬取网页数据，这一节我们继续深入的讲解python爬虫的实现。今天要将的是使用python3爬取网络图片，并保存到本地。本节知识点1，python3爬取网站源码2，正则匹配获取图片链接3，使用python3将不怕保存到本地一，首先我们来看下要爬取的网址下图箭头所指的就是我们要爬取的图片。二，爬取网址源码到本地通过上图我们可以看到，我们成功的爬取...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。