代码如下:
# -*- coding: utf-8 -*
import urllib.request,socket,re,sys,os
savepath=r'C:\\Users\\Administrator\\PycharmProjects\\untitled\\venv1\\image\\'
def saveimage(url):
if not os.path.isdir(savepath):
os.mkdir(savepath)
begin=url.rindex('/') #获取图片名字的位置的前一位作为索引,最后一个'\'号的位置
imagepath=os.path.join(savepath,url[begin+1:]) #path[begin+1:]截取图片名字',并加其加入到文件路径
return imagepath
url='https://www.douban.com/'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
req=urllib.request.Request(url=url,headers=headers)
page=urllib.request.urlopen(req)
html=page.read()
reg=r'(https:[^\s]*?(png|gif|jpg))'
imag=re.compile(reg)
imageurls=re.findall(imag,str(h