本文技术栈:
爬虫
Flask
pyecharts
1.序
之前写过一个用 python 自动生成球员职业生涯数据的程序,大家的反响很好,我也感到很欣慰。有问我怎么做的,如何学 python 的,也有提建议说集成到 web 里面的。
其实最开始我也是考虑到集成到 web 里面,但是由于时间关系,只是简单的做了一下,没想到引起了大家的关注和建议。所以这次就做了升级,集成到 web 中!
先看效果吧,比如在本地:
http:// 127.0.0.1:5800/retire/p layer?retire= 乔丹&game=1
![acc5e455b86698e51d639ec04201335b.gif](https://img-blog.csdnimg.cn/img_convert/acc5e455b86698e51d639ec04201335b.gif)
http:// 127.0.0.1:5800/retire/p layer?retire= 科比&game=1
![9cdbc9ce03b940dd98681fd0f7b99206.gif](https://img-blog.csdnimg.cn/img_convert/9cdbc9ce03b940dd98681fd0f7b99206.gif)
2.环境配置
.语言:Python3.编辑器:Pycharn.web框架:Flask.数据可视化:Pyecharts
项目主目录有个 requirements.txt 文件,里面是项目所需要的依赖包,你只需在终端输入以下命令
pip install -r requirements.txt
依赖包就会自动安装
![503acdf5ba8d95e68ff6e3f7db7efab9.png](https://img-blog.csdnimg.cn/img_convert/503acdf5ba8d95e68ff6e3f7db7efab9.png)
3.功能升级
现升级完之后加入了以下功能:
3.1 将爬虫集成到web中,通过在浏览器输入球队名称获取球队下所有球员
http:// 127.0.0.1:5800/nba/team? name= 猛龙
![89fc1d44382297a908e3fc2921c1f9d7.png](https://img-blog.csdnimg.cn/img_convert/89fc1d44382297a908e3fc2921c1f9d7.png)
![69ca0469f95559dfbfdfe7ca1917e97d.png](https://img-blog.csdnimg.cn/img_convert/69ca0469f95559dfbfdfe7ca1917e97d.png)
3.2 支持现役所有球员生涯数据曲线,同时包括常规赛和季后赛数据
伦纳德常规赛和季后赛数据
http:// 127.0.0.1:5800/nba/play er?game=0&player=kawhileonard-3568.html&color=yellow
![af586e0943f704b56f8543543b4a0aa3.gif](https://img-blog.csdnimg.cn/img_convert/af586e0943f704b56f8543543b4a0aa3.gif)
当 game=0 的时候,获取常规赛数据,game=1 获取季后赛数据
不得不吐糟一下公众号只支持上传 2M 以下的 gif, gif 大了又不支持, gif 小了又不清晰...
所以很多时候录完视频后裁剪成 gif 要花费十几二十分钟的时间,很痛苦...哪位朋友有好方法,还请联系我!
3.3 同时支持退役球星数据,比如篮球界第一老流氓 乔丹
![8a4315ef33d79d70ef490d09151d9f69.png](https://img-blog.csdnimg.cn/img_convert/8a4315ef33d79d70ef490d09151d9f69.png)
![2b3dfba33be98342de516ac8e4ec5f22.png](https://img-blog.csdnimg.cn/img_convert/2b3dfba33be98342de516ac8e4ec5f22.png)
3.4 支持更改背景颜色,同时支持图片下载
比如 魔术师约翰逊 的数据,在请求的时候加入 color 参数
http:// 127.0.0.1:5800/retire/p layer?retire= 魔术师&game=1&color=yellow
![5851c3f96470b7c537d6e8e25f358bf8.png](https://img-blog.csdnimg.cn/img_convert/5851c3f96470b7c537d6e8e25f358bf8.png)
根据你传的 color 设置背景色,同时左上角有个下载按钮,点击可下载。是不是很强大!
4.代码讲解
4.1 Flask部分
请求地址:共有三个请求地址,代码所在 urls.py,可以根据个人喜好修改地址
![9e2eda869fe959590e68c4e3c5e9990a.png](https://img-blog.csdnimg.cn/img_convert/9e2eda869fe959590e68c4e3c5e9990a.png)
其中根据球队获取球员地址为 /nba/team/, 现役球员生涯数据为 /nba/player/, 退役球星数据为 /retire/player/
请求参数:代码所在 forms.py
![1e92d52fa40df022bf080c576a722ce5.png](https://img-blog.csdnimg.cn/img_convert/1e92d52fa40df022bf080c576a722ce5.png)
具体该传什么参数,代码在上面。其中 color 是可选的!
运行项目:项目主目录下有个 run.py 文件,直接运行即可!
4.2 爬虫部分
之前程序是抓的虎扑上面的数据,虎扑网有个 bug :每个球员都多了一条 2017 年汇总的数据(不清楚是干什么的),现已修正。而且虎扑不支持历史球员数据查询,所以现在加入了一个新网站,代码部分如下:
![bc1fca6100580313b9b9011eee9d9655.png](https://img-blog.csdnimg.cn/img_convert/bc1fca6100580313b9b9011eee9d9655.png)
主要涉及到 html 提取技术,之前文章都有介绍,不详说了。
4.3 数据可视化部分
此部分主要是将 pyecharts 集成到 flask 中,集成的文件在 templates 中有些是默认文件,新增的部分是发送 ajax 请求,生成球员曲线。没有什么太多要说的,因为我之前的文章都有介绍过 pyecharts 的用法
Python编程与实战