相关知识
1.URL处理模块(库)
import urllib.request as req
2.创建一个表示远程url的类文件对象
req.urlopen(' ')
3.导入re包(正规表达式包)
import re
re.findall (pattern, string [, flags] )正规表达式
菜鸟教学
一:打开一个 URL ,获取网页数据
from urllib import request
import re
def getReq(url):
url_req = request.urlopen(url) # 打开一个url
return url_req
http_req = getReq("http://www.netbian.com/")
# 拿到http请求后的上下文对象(HTTPResponse object)
data = http_req.read().decode('GB2312') # 获取网页数据
print(data)
部分网页数据图
二:获取图像链接
def getJpg(data):
jpglist = re.findall(r'src="http.+?.jpg"',data)
return jpglist
Link = getJpg(data)
print(Link)
图像链接图
三:下载图像文件
def downLoad(jpgUrl,n):
try:
request.urlretrieve(jpgUrl,'%s.jpg' %n)
except Exception as e:
print(e)
finally:
print(' 图片%s 下载操作完成' % n)
n=1
for jpgurl in Link:
s = re.findall(r'http.+?.jpg',jpgurl)
downLoad(s[0],n)
n= n +1
图片下载完成图
完整代码如下图
完整代码图
温馨提示:下载的图片会保存在你当前Python文件所在目录!刚接触Python你需要注意每条代码的缩进!