王者荣耀是目前非常火的一款游戏,相信大家都对其中的人物很感兴趣,那么今天就带大家来爬取王者荣耀的皮肤,可以选一款喜欢的来当电脑壁纸。第一步,拿到url地址
第二步,获取各个人物皮肤数据
第三步,保存文件
第一步,拿到url地址
这是网站的初始url:
https://pvp.qq.com/web201605/wallpaper.shtml
进入网站后,通过分析,我们观察到壁纸的链接是在li标签下的a标签中:
但查看网页源码发现,其中没有找到想要的链接数据,考虑接口分析。
在network抓包工具中,考虑图片链接都放在列表中,从中找到带有worklist字样的数据,从中找到了我们想要的数据。
需要注意,是第二个而不是第一个,因为第二个worklist包含了第一页的20张图片所有数据,而第一个只有一张图的数据。
这就是图片的链接,只是经过了一些处理:
在Headers下,可以从中得到目标的url:
url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?
activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=4&totalpage=0&p
age=0&iOrder=0&iSortNumClose=1&jsoncallback=jQuery17107950852797281271_1
597938787695&iAMSActivityId=51991&_everyRead=true&iTypeId=1&iFlowId=2677
33&iActId=2735&iModuleId=2735&_=1597938787974'
需要注意的是,请求时要把其中的callback参数删掉。
url = 'https://apps.game.qq.com/cgi-bin/ams/module/ishow/V1.0/query/workList_inc.cgi?activityId=2735&sVerifyCode=ABCD&sDataType=JSON&iListNum=4&totalpage=0&page=0&iOrder=0&iSortNumClose=1&iAMSActivityId=51991&_everyRead=true&iTypeId=1&iFlowId=267733&iActId=2735&iModuleId=2735&_=1597938787974'
第二步,获取各个人物皮肤数据
继续分析抓包里的数据,可以发现有20个人物的图片链接及图片人物名称(每一个人物有8张图片)。下面来获取这些数据。
先导入相关模块:
import requests
import json
from urllib import parse # 解码网站
from urllib import request # 用于之后的文件下载
import os # 保存文件
构造简单的requests请求:
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'
,'referer':'https://pvp.qq.com/web201605/wallpaper.shtml'
}
resp = requests.get(url,headers=headers)
# 将json数据转换为字典数据
result = resp.json()
print result
结果如下:
接下来要把List下的各图片链接提取出来,并做一个遍历,代码如下:
datas = result['List']
for data in datas:
# 获取图片url,并解码(其中要把url中的200换成0,这样的图片更大)
image_urls = [parse.unquote(data['sProdImgNo_{}'.format(i)]).replace('200','0') for i in range(1,9)]
# 获取图片的名字,并解码
name = parse.unquote(data['sProdName'])
print(image_urls)
print(name)
print('=' * 50)
这一步结果如下,可以看到20个人物的图片链接及名字已经爬取到:
第三步,保存文件
这里咱们使用之前导入的os模块,这样保存文件更方便,代码如下:
# 创建文件夹 在文件夹image下创建各自的名字文件
dirpath = os.path.join('image',name)
os.mkdir(dirpath)
# 下载图片(用enumerate()获取到各链接的索引值)
for index, image_url in enumerate(image_urls):
request.urlretrieve(image_url, os.path.join(dirpath, '%d.jpg' % (index + 1)))
print('%s下载完成!' % (image_url))
结果如下:
这里需要注意,要提前在py文件所在文件夹创建image文件,否则报错:提示文件路径不存在。
至此,咱们对王者荣耀皮肤就爬取完毕了,感兴趣的小伙伴自己可以试一试!
最近在知乎创建了一个新的Python技术圈子,在里面每天都会分享好玩有趣的Python知识,你如果对Python这门技术感兴趣的可以加入哦!交个朋友Python技术 - 知乎www.zhihu.com