如何运用python爬游戏皮肤_Python爬虫实战之 爬取王者荣耀皮肤

王者荣耀是目前非常火的一款游戏,相信大家都对其中的人物很感兴趣,那么今天就带大家来爬取王者荣耀的皮肤,可以选一款喜欢的来当电脑壁纸。第一步,拿到url地址

第二步,获取各个人物皮肤数据

第三步,保存文件

第一步,拿到url地址

这是网站的初始url:

https://pvp.qq.com/web201605/wallpaper.shtml

进入网站后,通过分析,我们观察到壁纸的链接是在li标签下的a标签中:

但查看网页源码发现,其中没有找到想要的链接数据,考虑接口分析。

在network抓包工具中,考虑图片链接都放在列表中,从中找到带有worklist字样的数据,从中找到了我们想要的数据。

需要注意,是第二个而不是第一个,因为第二个worklist包含了第一页的20张图片所有数据,而第一个只有一张图的数据。

这就是图片的链接,只是经过了一些处理:

在Headers下,可以从中得到目标的url:

url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?

activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=4&totalpage=0&p

age=0&iOrder=0&iSortNumClose=1&jsoncallback=jQuery17107950852797281271_1

597938787695&iAMSActivityId=51991&_everyRead=true&iTypeId=1&iFlowId=2677

33&iActId=2735&iModuleId=2735&_=1597938787974'

需要注意的是,请求时要把其中的callback参数删掉。

url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=4&totalpage=0&page=0&iOrder=0&iSortNumClose=1&iAMSActivityId=51991&_everyRead=true&iTypeId=1&iFlowId=267733&iActId=2735&iModuleId=2735&_=1597938787974'

第二步,获取各个人物皮肤数据

继续分析抓包里的数据,可以发现有20个人物的图片链接及图片人物名称(每一个人物有8张图片)。下面来获取这些数据。

先导入相关模块:

import requests

import json

from urllib import parse # 解码网站

from urllib import request # 用于之后的文件下载

import os # 保存文件

构造简单的requests请求:

headers = {

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'

,'referer':'https://pvp.qq.com/web201605/wallpaper.shtml'

}

resp = requests.get(url,headers=headers)

# 将json数据转换为字典数据

result = resp.json()

print result

结果如下:

接下来要把List下的各图片链接提取出来,并做一个遍历,代码如下:

datas = result['List']

for data in datas:

# 获取图片url,并解码(其中要把url中的200换成0,这样的图片更大)

image_urls = [parse.unquote(data['sProdImgNo_{}'.format(i)]).replace('200','0') for i in range(1,9)]

# 获取图片的名字,并解码

name = parse.unquote(data['sProdName'])

print(image_urls)

print(name)

print('=' * 50)

这一步结果如下,可以看到20个人物的图片链接及名字已经爬取到:

第三步,保存文件

这里咱们使用之前导入的os模块,这样保存文件更方便,代码如下:

# 创建文件夹 在文件夹image下创建各自的名字文件

dirpath = os.path.join('image',name)

os.mkdir(dirpath)

# 下载图片(用enumerate()获取到各链接的索引值)

for index, image_url in enumerate(image_urls):

request.urlretrieve(image_url, os.path.join(dirpath, '%d.jpg' % (index + 1)))

print('%s下载完成!' % (image_url))

结果如下:

这里需要注意,要提前在py文件所在文件夹创建image文件,否则报错:提示文件路径不存在。

至此,咱们对王者荣耀皮肤就爬取完毕了,感兴趣的小伙伴自己可以试一试!

最近在知乎创建了一个新的Python技术圈子,在里面每天都会分享好玩有趣的Python知识,你如果对Python这门技术感兴趣的可以加入哦!交个朋友Python技术 - 知乎​www.zhihu.com

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值