提取的方式可自行选择,小编这里使用正则的方式提取数据,提取详情页面的地址以及标题,用来保存图片起名字,获取到进入详情页面的地址后对地址发送请求,详情页面的数据也分为很多的页面,每个页面有好几张图片,需要对网址进行拼接,构造出新的地址信息,
for i in range(1, int(page_num[0]) + 1):
if i == 1:
new_url = info_url
else:
new_url = info_url.replace(‘.html’, f’_{i}.html’)
print(new_url)
jpg_data = requests.get(new_url, headers=headers).content.decode(‘gbk’)
请求之后