使用python requests模块爬取《王者荣耀》英雄皮肤
requests 模块介绍
Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库。与urllib相比,Requests更加方便,可以节约我们大量的工作,建议爬虫使用Requests库。
pip install requests
思路分析
获取王者荣耀英雄列表:https://pvp.qq.com/web201605/js/herolist.json 该地址返回的是一个json对象
获取王者荣耀英雄皮肤地址:http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{}/{}-bigskin-{}.jpg {}表示王者荣耀地址需要的英雄id(可以在上面的json文件中找到 ename,) 最后一个{}需要的是第几个皮肤,相信大家有办法能够自己解决(通过获取列表的长度)
然后获取皮肤图片的下载地址
这里需要用到 urllib中的request来进行图片的保存(urllilb为python自带的模块,不需要安装)
代码实现
1、使用requests.get()获取json文件
url = 'https://pvp.qq.com/web201605/js/herolist.json'
resp = requests.get(url)
2、遍历json文件中的每个英雄
for i in resp.json():
if i['ename'] == 518: # 这里有一个特殊情况就是马超的皮肤对象名字不一样, 做特殊处理
continue
pifu_id = i['ename']
hero_name = i['cname']
hero_pifu = i['skin_name']
3、拿到皮肤名字后需要进行处理
hero_pifu = hero_pifu.split('|') # 使用split方法进行字符串切割
4、对英雄进行分类存储,需要自动创建文件夹
import os
path = './王者荣耀皮肤/{}/'.format(hero_name)
os.makedirs(path) # 自动创建文件夹
5、对英雄的皮肤列表进行遍历 获取对应的皮肤下载地址,然后进行存储
for j in range(0, len(hero_pifu)):
img_url = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{}/{}-bigskin-{}.jpg'
img = img_url.format(pifu_id, pifu_id, j+1)
request.urlretrieve(img, path+hero_pifu[j]+'.jpg') # 下载图片并保存
效果展示
> python技术交流群:716167444
> 到这里就结束了,如果对你有帮助,欢迎点赞关注评论,你的点赞就是我坚持更新的动力。