如何运用python爬游戏皮肤_Python爬虫实战之爬取王者荣耀皮肤

最新推荐文章于 2022-03-02 03:29:45 发布

weixin_39988164

最新推荐文章于 2022-03-02 03:29:45 发布

阅读量159

点赞数

文章标签：如何运用python爬游戏皮肤

王者荣耀是目前非常火的一款游戏，相信大家都对其中的人物很感兴趣，那么今天就带大家来爬取王者荣耀的皮肤，可以选一款喜欢的来当电脑壁纸。第一步，拿到url地址

第二步，获取各个人物皮肤数据

第三步，保存文件

第一步，拿到url地址

这是网站的初始url：

https://pvp.qq.com/web201605/wallpaper.shtml

进入网站后，通过分析，我们观察到壁纸的链接是在li标签下的a标签中：

但查看网页源码发现，其中没有找到想要的链接数据，考虑接口分析。

在network抓包工具中，考虑图片链接都放在列表中，从中找到带有worklist字样的数据，从中找到了我们想要的数据。

需要注意，是第二个而不是第一个，因为第二个worklist包含了第一页的20张图片所有数据，而第一个只有一张图的数据。

这就是图片的链接，只是经过了一些处理：

在Headers下，可以从中得到目标的url：

url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?

activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=4&totalpage=0&p

age=0&iOrder=0&iSortNumClose=1&jsoncallback=jQuery17107950852797281271_1

597938787695&iAMSActivityId=51991&_everyRead=true&iTypeId=1&iFlowId=2677

33&iActId=2735&iModuleId=2735&_=1597938787974'

需要注意的是，请求时要把其中的callback参数删掉。

url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=4&totalpage=0&page=0&iOrder=0&iSortNumClose=1&iAMSActivityId=51991&_everyRead=true&iTypeId=1&iFlowId=267733&iActId=2735&iModuleId=2735&_=1597938787974'

第二步，获取各个人物皮肤数据

继续分析抓包里的数据，可以发现有20个人物的图片链接及图片人物名称(每一个人物有8张图片)。下面来获取这些数据。

先导入相关模块：

import requests

import json

from urllib import parse # 解码网站

from urllib import request # 用于之后的文件下载

import os # 保存文件

构造简单的requests请求：

headers = {

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'

,'referer':'https://pvp.qq.com/web201605/wallpaper.shtml'

}

resp = requests.get(url,headers=headers)

# 将json数据转换为字典数据

result = resp.json()

print result

结果如下：

接下来要把List下的各图片链接提取出来，并做一个遍历，代码如下：

datas = result['List']

for data in datas:

# 获取图片url，并解码(其中要把url中的200换成0，这样的图片更大)

image_urls = [parse.unquote(data['sProdImgNo_{}'.format(i)]).replace('200','0') for i in range(1,9)]

# 获取图片的名字，并解码

name = parse.unquote(data['sProdName'])

print(image_urls)

print(name)

print('=' * 50)

这一步结果如下，可以看到20个人物的图片链接及名字已经爬取到：

第三步，保存文件

这里咱们使用之前导入的os模块，这样保存文件更方便，代码如下：

# 创建文件夹在文件夹image下创建各自的名字文件

dirpath = os.path.join('image',name)

os.mkdir(dirpath)

# 下载图片(用enumerate()获取到各链接的索引值)

for index, image_url in enumerate(image_urls):

request.urlretrieve(image_url, os.path.join(dirpath, '%d.jpg' % (index + 1)))

print('%s下载完成!' % (image_url))

结果如下：

这里需要注意，要提前在py文件所在文件夹创建image文件，否则报错：提示文件路径不存在。

至此，咱们对王者荣耀皮肤就爬取完毕了，感兴趣的小伙伴自己可以试一试！

最近在知乎创建了一个新的Python技术圈子，在里面每天都会分享好玩有趣的Python知识，你如果对Python这门技术感兴趣的可以加入哦！交个朋友Python技术 - 知乎www.zhihu.com

weixin_39988164

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何运用python爬游戏皮肤_Python爬虫实战之爬取王者荣耀皮肤

王者荣耀是目前非常火的一款游戏，相信大家都对其中的人物很感兴趣，那么今天就带大家来爬取王者荣耀的皮肤，可以选一款喜欢的来当电脑壁纸。第一步，拿到url地址第二步，获取各个人物皮肤数据第三步，保存文件第一步，拿到url地址这是网站的初始url：https://pvp.qq.com/web201605/wallpaper.shtml进入网站后，通过分析，我们观察到壁纸的链接是在li标签下的a标签中：但...
复制链接

扫一扫

如何运用python爬游戏皮肤_Python爬虫实战之 爬取王者荣耀皮肤

“相关推荐”对你有帮助么？

如何运用python爬游戏皮肤_Python爬虫实战之爬取王者荣耀皮肤