python用xpath爬取10页网站图片

#爬取网站图片
import requests
from lxml import etree  
import os

i=0  #计数
#请求头
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"}
for x in range(1,11):
	html="https://www.zerochan.net/Yukinoshita+Yukino?p="+str(x)   #一共10页图片
	r=requests.get(html,headers=headers)  #请求响应
	
	#解析网页内容
	html=etree.HTML(r.text)

	root="F://z yukinoshita/"  #需要存储的根目录
	if not os.path.exists(root):    #判断根目录是否存在
		os.mkdir(root)  	 #不存在则创建文件夹

	url=html.xpath('//*[@id="thumbs2"]/li/a/img/@src')  #从网页信息中获取图片链接
	z=len(url)
	for y in range(0,z):
		html_1="https://static.zerochan.net/Yukinoshita.Yukino.full."+url[y].split('/')[-1]
		image_name=html_1.split('/')[-1]    #图片的名字
	
		path=root+image_name     #图片在电脑的路径及名字
		try:
			if not os.path.exists(path):       #如果电脑中不存在该图片
				with open(path,'wb') as f:   #把图片写进图片文件
					con=requests.get(html_1)    #请求图片链接的信息
					f.write(con.content)	 #将图片的二进制写入文件
					i=i+1
					print("爬取成功"+str(i))
			else:
				i=i+1
				print("文件已存在"+str(i))		
		except:    
			i=i+1
			print("爬取失败"+str(i))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值