其实我是不喜欢玩王者荣耀,也许是有点菜,对于在职业联赛中那些英雄是处于什么水平,我还是比较关心的。
数据来源:https://datamore.qq.com/project/wzmatch/dist/index.html#/
所需要的技术:
1.python数据分析
2.python数据爬虫
3.python可视化以及百度echarts可视化工具
step1.爬取王者荣耀官方网站,获取所要数据。
- 在进入该网站需要进行登录,我就选择qq登录了
- 登录之后点击英雄,进入赛事,选择2020KPL职业联赛春季赛,数据如下:
- 打开开发者者工具(F12)
从以下图片看出,由于要进行多页爬取,我更改了页数url还是没有变化,说明url并不是get请求方式实现。那么说明网页是动态网页,使用XHR进行变换数据的。
- 查看NetWork -> HRX信息:
从截图看出,服务器拒绝了你的访问请求,能力有限,我没办法,动态页面我目前还没有办法能够解决。
爬取失败,我想应该要用到爬虫Spider框架进行爬取,好在王者荣耀官网比较友好直接让你导出数据,数据如下:
step2.对数据进行分析
- 首先导入数据到jupyter notebook上