将网站上的图片保存下来

最新推荐文章于 2024-05-09 11:16:45 发布

Cappuccanio

最新推荐文章于 2024-05-09 11:16:45 发布

阅读量955

点赞数

本文链接：https://blog.csdn.net/lzw369639/article/details/83008785

版权

# coding=utf-8
import urllib.request
import re

html = 'https://coding.imooc.com/'

req = urllib.request.urlopen(html)  # 打开网站

buf = req.read()  # 把读取的内容缓存在内存上

buf = buf.decode('utf-8') # 把网页上读取到的内容编码为utf-8，否则出现TypeError: cannot use a string pattern on a bytes-like object。

listurl = re.findall(r'\/\/.+\.jpg',buf)  # 正则表达式读取以src开头和.jpg结尾的字符串

k = 0
s = 'http:'
for x in listurl:   # 进行字符串的拼接，否则会出现ValueError:unknown url type: '//img.mukewang.com/5b5188020001677306000338-240-135.jpg" src="//img.mukewang.com/5b5188020001677306000338-240-135.jpg'
    x = s + x
    listurl[k] = x
    k += 1
# print(listurl)
i = 0
for url in listurl:
    f = open(str(i)+'.jpg','wb+')  # 文件打开方式有问题，应修改为用二进制方式打开wb+，否则出现TypeError: write() argument must be str, not bytes
    req = urllib.request.urlopen(url)
    buf = req.read()
    f.write(buf)
    i += 1

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cappuccanio

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
将网站上的图片保存下来

# coding=utf-8import urllib.requestimport rehtml = 'https://coding.imooc.com/'req = urllib.request.urlopen(html) # 打开网站buf = req.read() # 把读取的内容缓存在内存上buf = buf.decode('utf-8') # 把网页上读取到的内...
复制链接

扫一扫