python--千库网素材爬取

'''搞事情! 千库网圣诞素材图片抓取(仅一页,其他自己循环)'''
import requests													 #requests请求模块
import re  														 #re正则匹配模块
import random 														 #随机数字模块
response = requests.get('http://588ku.com/png-zt/68.html')  		 #访问千库网站后去响应;
index = response.text												 #获取到响应的文件;
url = re.findall(r'<div class="img-box"><a  href="(.*?)" target="_blank">',index) #正则匹配出每张图片的url
for i in url: 														 #循环处理每个url;
	response = requests.get(i) 									 #访问url得到响应信息;
	info = response.text 
	img_url_list = re.findall(r'src="(.*?)"/></div>', info) 		 #正则匹配出image的url链接   
	img_url = 'http:' + img_url_list.pop(0)						 #转为str形式;
	file_path = 'E:\python\练习\python_try\image\{}.{}'.format(random.randrange(60),'jpg') 		#设置存储路径,可更改
	with open(file_path, 'wb') as f:								 #保存图片 ‘wb’以二进制形式写入
		info_img_url = requests.get(img_url) 
		f.write(info_img_url.content) 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值