一、导入urllib.request、re两个模块 import urllib.request (用于打开URL的可扩展库) import re (用于正则匹配) 二、爬取步骤 1、确定爬取地址 path="要爬取的网站地址(前面需接http://)" 2、根据地址获取源代码 content=urllib.request.urlopen(path).read().decode("utf-8","ignore") 3、写正则表达式,匹配相应的数据 match=re.compile(r'src="(.*?\.jpg)"') 4、保存 imagePaths=match.findall(content) i=0 for imagePath in imagePaths: if "https://www.baidu.cn" not in imagePath: imagePath="https://www.baidu.cn"+imagePath i = i + 1 urllib.request.urlretrieve(imagePath, f"C:\\Users\\Administrator\\Desktop\\图片\\{i}.jpg") 这里填的是保存的地址