2021-04-02

最新推荐文章于 2024-09-27 10:11:28 发布

python 扫地僧

最新推荐文章于 2024-09-27 10:11:28 发布

阅读量173

点赞数 1

分类专栏： python 案例实战文章标签： python 爬虫网络协议游戏编程语言

本文链接：https://blog.csdn.net/chase97/article/details/115408440

版权

python 案例实战专栏收录该内容

3 篇文章 0 订阅

订阅专栏

使用python requests模块爬取《王者荣耀》英雄皮肤

requests 模块介绍

Requests是用python语言基于urllib编写的，采用的是Apache2 Licensed开源协议的HTTP库。与urllib相比，Requests更加方便，可以节约我们大量的工作，建议爬虫使用Requests库。

pip install requests

思路分析

获取王者荣耀英雄列表：https://pvp.qq.com/web201605/js/herolist.json 该地址返回的是一个json对象

获取王者荣耀英雄皮肤地址：http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{}/{}-bigskin-{}.jpg {}表示王者荣耀地址需要的英雄id（可以在上面的json文件中找到 ename，）最后一个{}需要的是第几个皮肤，相信大家有办法能够自己解决（通过获取列表的长度）

然后获取皮肤图片的下载地址

这里需要用到 urllib中的request来进行图片的保存（urllilb为python自带的模块，不需要安装）

代码实现

1、使用requests.get()获取json文件

url = 'https://pvp.qq.com/web201605/js/herolist.json'
resp = requests.get(url)

2、遍历json文件中的每个英雄

for i in resp.json():
    if i['ename'] == 518:  # 这里有一个特殊情况就是马超的皮肤对象名字不一样， 做特殊处理
        continue
    pifu_id = i['ename']
    hero_name = i['cname']
    hero_pifu = i['skin_name']

3、拿到皮肤名字后需要进行处理

hero_pifu = hero_pifu.split('|')  #  使用split方法进行字符串切割

4、对英雄进行分类存储，需要自动创建文件夹

import os
path = './王者荣耀皮肤/{}/'.format(hero_name)
os.makedirs(path)  # 自动创建文件夹

5、对英雄的皮肤列表进行遍历获取对应的皮肤下载地址，然后进行存储

for j in range(0, len(hero_pifu)):
   img_url = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{}/{}-bigskin-{}.jpg'
   img = img_url.format(pifu_id, pifu_id, j+1)
   request.urlretrieve(img, path+hero_pifu[j]+'.jpg') # 下载图片并保存