我是一个NBA的球迷,一直很喜欢科比的球风和“曼巴精神”,于是想写一篇文章看一下他的整个NBA生涯的数据情况是怎样的,这应该是一件有趣的事情。
使用工具:Ipython notebook
用到的库:Pandas,Matplotlib
1.数据来源
本次用到的数据来源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以选择多种形式,我选的是CSV格式,方便后面的数据分析,看看数据长什么样呢
2.导入数据
1).数据集是一个下载好的csv文件( csv是数据分析金牌御用文件格式),我们把数据导入到pandas之后,初步分析一下
>>
(20, 30) #数据集是一个20行30列的大表格,正好是20年的数据
看一些数据的基本统计分析信息:
20年平均得分是24.2分,相当厉害,最高得分是35.4,最低7.6,那我们继续横向探索数据
2).接下来就可以继续分析了,一般来说,我们经常关注的是球员的得分,篮板,助攻,抢断和盖帽的能力,所以我们可以从这5个方面来分析,先来看一下科比的得分的基本情况
>>
常规赛总得分: 3363