爬虫（三）——获取网页图片并保存在本地

最新推荐文章于 2024-05-09 11:16:45 发布

可欣の扣得儿

最新推荐文章于 2024-05-09 11:16:45 发布

阅读量1.2k

点赞数

分类专栏：爬虫

本文链接：https://blog.csdn.net/aspirinLi/article/details/104532606

版权

爬虫专栏收录该内容

10 篇文章 1 订阅

订阅专栏

以京东商城的商品图片为例，涉及的知识点有：

1.正则匹配获取图片地址

2.修正图片地址格式

3.用request.get(url)获取图片链接，并通过os操作保存到本地。

代码如下：

import requests
import re

url = 'https://channel.jd.com/1713-3258.html'
res = requests.get(url)
res.encoding = 'gbk'

image_pat = '<img src="" data-lazy-img="(.*?)" width="160" height="160">'
image_list = re.findall(image_pat,res.text)

#将图片保存到本地
for i in range(len(image_list)):
    # 将图片地址的格式整理一下
    image_list[i] = 'http:'+image_list[i]
    print(i)
    res = requests.get(image_list[i])
    #'wb'指用二进制方式写入文件，文件地址改成你想保存的地址
    with open('D:/TensorflowTest/PaChong/img/'+str(i)+'.jpg','wb') as pic_object:
        #对于非文本请求，用content
        pic_object.write(res.content)

运行后效果如下：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

可欣の扣得儿

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
爬虫（三）——获取网页图片并保存在本地

以京东商城的商品图片为例，涉及的知识点有：1.正则匹配获取图片地址2.修正图片地址格式3.用request.get(url)获取图片链接，并通过os操作保存到本地。代码如下：import requestsimport reurl = 'https://channel.jd.com/1713-3258.html'res = requests.get(url)res.e...
复制链接

扫一扫