import requests
import re
import os
#如果目录不存在,那么创建目录,反之不创建
if not os.path.exists(’./qiutuLibs’):
os.mkdir('./qiutuLibs')
url = ‘https://www.qiushibaike.com/imgrank/’
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'
}
#解析页面以二进制的形式
page_text = requests.get(url=url,headers=headers).text
#利用正则定位出图片url地址,以便于下载
ex = ‘
.
?<img src="(.?)" alt.*?
’
img_src_list = re.findall(ex,page_text,re.S)
for src in img_src_list:
#拼接出一个完整的链接
src = 'https:'+src
#请求到图片的二进制数据
img_data = requests.get(url=src,headers=headers).content
#给你的图片命名
img_name = src.split('/&