python含金量_【干货贴】Python爬虫数据分析2001年至今东西部周最佳数据,比较真正的含金量...

最近在论坛确实看到一些人认为东部周最佳完全比不上西部周最佳的言论,乃至于出现了认为东部周最佳不算啥荣耀的说法。

本着千万不要印象流的原则,我决定发挥我程序员的本职功能,写了一个python爬虫。扒取了2001年至今所有的东西部周最佳的数据进行对比。至于为什么是从2001年开始,是因为在那个赛季之前,是不分东西部周最佳的,在01赛季开始,才区分东西部周最佳。想要直接看结果的,可以跳到最后。

数据来源:http://www.stat-nba.com/award/item18.html

如果对数据有怀疑,可以直接上去查证。

数据比较多,我只截取一部分excel的截图出来。如下:

format,webp

获取到数据后的第一个问题就是如何比较东西部周最佳的数据,这个是最大的争论点,考虑到使用per值会被人说是偏袒某人,我就想用简单粗暴的数据相加来比较,数据谁比较吊就拿周最佳应该没啥毛病吧。

我决定使用GmSc效率值的方式来比较。这也是比较单场或者几场比赛相对较好的方式,也和人们印象里“谁数据吊谁拿周最佳”这个印象是相符的一个数值。

公式为:

GmSc效率值 = 得分+0.4×投篮命中数-0.7×投篮出手数-0.4×(罚球出手数-罚球命中数)+0.7×前场篮板数+0.3×后场篮板数+抢断数+0.7×助攻数+0.7×盖帽数-0.4×犯规数-失误数

公式来源于 http://www.stat-nba.com/about.php#glossary

计算直接由Excel得出,结果也比较多,我放一部分截图:

format,webp

取一个数据对比一下,11月04日-11月10日的东西部周最佳是哈登和西亚卡姆,哈登的GmSc是32.28,西卡的是23.58,确实是西部的哈登数据更厉害,这个例子的比较结果是西部胜出。

那现在激动人心的时刻来了,我们来比较所有的东西部周最佳数据,来看看20年来东西部周最佳分别胜出几次,也就能知道是不是东部周最佳水分更大。

计算过程我就不列出了,直接上结果。

format,webp

结果是西部周最佳胜出217次,东部周最佳胜出188次

西部周最佳胜出次数确实多了29次,比东部多15%左右,这个结果虽然说证实了西部周最佳确实更强,但很难说西部周最佳完全碾压东部。

敲黑板注意!!!!!

那么接下来是放大招,直接比较联盟里当红的几个球星获得的周最佳含金量,比较方式就是直接和当周的另一个周最佳比较GmSc。

如果胜了就是“有效”的周最佳,如果输了,那就是“注水”的周最佳。

这里只取2001年后开始区分东西部周最佳之后才加入联盟的球星,以免造成误差。

直接上结果:

placeholder.png

以下用“有效”代表当周数据胜过另一个周最佳,“注水”表示当周数据没有胜过另一个周最佳

老詹61次周最佳,有效的50次,注水的11次

哈登23次周最佳,有效的17次,注水的6次

威少19次周最佳,有效11次,注水8次

杜兰特26次周最佳,有效18次,注水8次

库里14次周最佳,有效11次,注水3次

戴维斯6次周最佳,有效5次,注水1次

欧文4次周最佳,有效3次,注水1次

字母哥10次周最佳,有效五次,注水5次

可以看出来,最近被质疑最多的老詹,周最佳“注水”数量,其实是在各大球星里面反而比例没那么高的。

如果按照那些球迷的理论,他的荣誉要大打折扣,那么别的球星的荣誉要被打更多的折扣。

结论:

从总体而言,东部周最佳的含金量比西部周最佳确实要略低,但是具体到老詹,他的东部周最佳可以说实打实的碾压当时的西部周最佳。

如果各位JRS还有不服的,可以找我要数据,我把每一条都发出来给你。如果还想要看到别的球星的数据的,可以回复找我要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值