python3.5爬取王者荣耀官网所有英雄的皮肤

最近 跟着老师爬取了王者荣耀逛网的英雄皮肤;

工具:Vscode

版本:python3.5

需要json文件:

获取步骤如下:

复制这个链接到浏览器,直接下载,乱码不用管是浏览器没解析好;

使用的时候,把json文件的地址换成自己的就行了。

代码如下:

# 导入模块
import requests # pip install requests
import json 

# 读取json文件
with open('X://Users//zhaomeng//Downloads//herolist.json','r',encoding='utf-8') as ff: # read
    jsonFile = json.load(ff)

# 提取json文件
for m in range(len(jsonFile)):

    # 数字名字
    ename = jsonFile[m]['ename'] 
    # 汉语名字
    cname = jsonFile[m]['cname'] 
    # 切割后是字典 列表形式
    skinName = jsonFile[m]['skin_name'].split('|') 
    # 计算每个英雄的皮肤多少
    skinNumber = len(skinName)
    print(skinNumber)
    # 此次循环是为了下载图片  构造图片网址
    for bigskin in range(1,skinNumber+1):  # 1-skinNumber
        # 指定图片网址
        urlPicture = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'+str(ename)+'/'+str(ename)+'-bigskin-'+str(bigskin)+'.jpg'
        # 获取图片信息  图片都是二进制  content就是获取二级制信息
        picture = requests.get(urlPicture).content
        # 保存信息 保存图片
        with open('X:\\Users\\zhaomeng\\Desktop\\1234\\'+cname+skinName[bigskin-1]+'.jpg','wb') as f:
            f.write(picture)        
        



结果如下:

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以为您提供一些思路和步骤: 1. 使用Python中的requests库和BeautifulSoup库来爬取王者荣耀官网上的英雄皮肤信息。可以使用以下代码片段获取英雄皮肤信息的网页源码: ```python import requests from bs4 import BeautifulSoup url = "https://pvp.qq.com/web201605/herolist.shtml" response = requests.get(url) html = response.content.decode('gbk') soup = BeautifulSoup(html, 'html.parser') ``` 2. 使用BeautifulSoup库解析网页源码,获取每个英雄的名称、皮肤数量和皮肤名称。可以使用以下代码片段来获取皮肤信息: ```python hero_list = soup.select('.herolist > li') for hero in hero_list: name = hero.select_one('.heroname').get_text() skin_num = len(hero.select('.skinlist > li')) skin_list = [] for skin in hero.select('.skinlist > li'): skin_name = skin.select_one('img')['alt'] skin_list.append(skin_name) ``` 3. 将获取到的皮肤信息存储到本地文件中。可以使用以下代码片段将皮肤信息写入到csv文件中: ```python import csv with open('hero_skin.csv', mode='w', newline='') as file: writer = csv.writer(file) writer.writerow(['hero_name', 'skin_num', 'skin_list']) for hero in hero_list: name = hero.select_one('.heroname').get_text() skin_num = len(hero.select('.skinlist > li')) skin_list = [] for skin in hero.select('.skinlist > li'): skin_name = skin.select_one('img')['alt'] skin_list.append(skin_name) writer.writerow([name, skin_num, skin_list]) ``` 4. 使用Python中的pandas库来读取csv文件,并进行数据清洗和可视化分析。可以使用以下代码片段读取csv文件并创建一个DataFrame对象: ```python import pandas as pd df = pd.read_csv('hero_skin.csv') ``` 5. 对数据进行清洗和处理,如去除重复数据、空值和异常值等。可以使用以下代码片段去除空值: ```python df.dropna(inplace=True) ``` 6. 进行可视化分析,如统计每个英雄皮肤数量分布、最受欢迎的皮肤等。可以使用以下代码片段绘制每个英雄皮肤数量分布图: ```python import matplotlib.pyplot as plt plt.hist(df['skin_num'], bins=20) plt.xlabel('Skin Num') plt.ylabel('Hero Num') plt.title('Distribution of Skin Num by Hero') plt.show() ``` 7. 根据需要进行更多的数据处理和可视化分析,如可视化每个英雄最受欢迎的皮肤皮肤类型分布等。 希望这些思路和步骤能够帮助您完成王者荣耀英雄皮肤爬取和可视化分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值