R语言怎么写积分_[R] - 数据解读足球的"主场优势"以及影响排名的因素...

5e8cbe69b99b2791548657fdfb66a5b9.png

足球的主场优势体现在: 地利(场地熟悉, 没有舟车劳顿)人和(球迷亲人助威, 老板督战)

从各大联赛的主客场积分上也能明显体现出来,比如英超16/17赛季主客场积分:

1db9601691d9aa294d0f7c2acb28172f.png

91e8f2bcfb036640e393114fd94ba295.png

几乎所有球队的主场战绩都要好于客场

----------

再看17/18赛季意甲积分情况

fac003a7e448dd0dc38a73f84d8a9834.png

进球最多的拉齐奥只能排第5,失球过多应该是一个主要原因,但到底是什么影响到最终的排名呢?光靠眼睛看每个赛季的图表可能有点吃力

那么下面就讨论一下如何用R语言从五大联赛赛季排名数据中寻找规律并 验证主场优势 以及 影响最终排名的主要因素


从pearson相关性系数看,和积分(即排名)相关性较高的为主场净胜球、主场积分、客场积分;相对主场战绩和总积分的相关性更高

53f2eb103e686909056eb608efbc52d8.png

残差并非完全服从正态分布,检查了离群值大部分是垫底球队的数据(一些垫底球队的丢球数和积分实在有些离谱),这里暂时忽略掉

6ccb9ee25a526295e7b812b8bc694e15.png

下面就从相关性最大的两个因素展开分析:

五大联赛2009~2018年所有球队积分+净胜球分布图(虚线表示平均值)

8c23f749f832795eed661962d30fb99b.png

251dcc28e94b3cdbeb417c5b42f3d797.png
  1. 积分、净胜球均值51.14、0
  2. 客场积分、净胜球均值20.57、-7.39
  3. 主场积分、净胜球均值30.6、7.39
可见主场优势在数据上体现的非常明显 所有指标都呈现正偏态分布,偏离较大的数值基本都是各大豪门贡献,足球界的金元效应明显

--------------

五大联赛2009~2018年前三名积分+净胜球分布图:

3e7068173e001983378772eb63564163.png

7ed34e40d6748d138efb3625d5d3da93.png
前三名净胜球均值主场是客场的2.08倍,但积分只有1.26倍;这说明了2点: 1. 想进入前3,客场拿分能力很重要 2. 即便是强队,在客场踢球会艰难很多 同时主场积分略微呈现负偏态分布,说明主场拿分能力是进入前3的最基本保障(44.43/(19*3) = 78%)

五大联赛2009~2018年冠军积分+净胜球分布图:

9764bef0595c933851b7da8979934075.png

cd57430d6834efaec648c6a8161b3e02.png
冠军净胜球均值主场是客场的1.76倍,积分1.21倍 冠军球队主场拿分率均值是恐怖的 48.29/(19*3) = 84.7%

五大联赛2009~2018年降级区积分+净胜球分布图:

de5629a7390bd028108eebc0813ae9f1.png

5b9793ea0a74deef93aaf41b1e12b333.png
降级区净胜球均值为-30.36,其中73%由客场贡献,积分主场贡献64%

换个姿势,以排名顺序看一下主客场的数据范围

关键几点

  • 主场优势显而易见
  • 冠军的客场净胜球至少是正值
  • 冠军的主场积分最少是40
  • 冠军客场失球数<=26
  • 前6的主场净胜球至少>=0
  • 前6的客场失球数<=35

c50dc00a81e7d8cdd72155df7537cc51.png

6500443eaba7e234c8203e43d5917978.png

1362fa0a94a7b6297a878680214d8093.png

17ea9a4fa3268d9e21a66d66727855a6.png

以上可视化图标涉及的包为: highcharter, GGally

jbkunst/highcharter​github.com
9eedaa6baaf12d9f3cb2b081ad7d9868.png
https://github.com/ggobi/ggally​github.com
3d38a0587c417099345958505f0b4d4e.png

本专栏只生产干货,喜欢请关注:

数据及可视化​zhuanlan.zhihu.com
634e3ec6bd79b4a9eb7e3edc7def5564.png
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值