python爬图片并按标题保存_python入门012~使用requests爬取网络图片并保存到本地...

上一节我们学习了python3借助requests类库爬取网页数据,这一节我们继续深入的讲解python爬虫的实现。今天要将的是使用python3爬取网络图片,并保存到本地。

本节知识点

1,python3爬取网站源码

2,正则匹配获取图片链接

3,使用python3将不怕保存到本地

一,首先我们来看下要爬取的网址

下图箭头所指的就是我们要爬取的图片。

二,爬取网址源码到本地

通过上图我们可以看到,我们成功的爬取到了网站源码,而这个网站的

三,正则表达式匹配图片链接

通过上图可以看出,我们成功的匹配到了网站源码里的图片链接,接下来,我们就要把这个图片保存在本地了。

四,保存图片到本地

如上图,我们做保存图片的时候,需要先在我们代码的外层目录创建一个 imgs文件夹,用于存放图片。然后编写核心代码。

五,完整代码如下。

六,运行代码,看下效果

可以看下我们爬取到的图片

最后把完整代码贴给大家

# python3爬取网络图片

import requests

import re

# 第一个爬取网址

url = 'http://www.nipic.com/photo/jingguan/ziran/index.html'

# 获得网页源码

data = requests.get(url).text

# print("网站源码", data)

# 图片正则表达式

regex = r'data-class="lazyload" src="https://img-blog.csdnimg.cn/2022010623195428710.png" data-original="(.*?.jpg)"'

# re是一个列表

pa = re.compile(regex) # 创建一个pa模板,使其符合匹配的网址

ma = re.findall(pa, data) # findall 方法找到data中所有的符合pa的对象,添加到re中并返回

# print(ma)

# 将ma中图片网址依次提取出来

i = 0

for image in ma:

i += 1

image = requests.get(image).content

print(str(i) + '.jpg 正在保存。。。')

with open('../imgs/' + str(i) + '.jpg', 'wb') as f: # 注意打开的是就jpg文件

f.write(image)

print('保存完毕')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值