欧洲足球五大联赛进球预测模型的构建

前言

近些年,统计学方法对足球预测的相应研究逐渐增多,从计量统计,到卡方检验、t检验,再到如今的泊松分布、蒙特卡洛、贝叶斯等等。本文将根据这类方法,从五大联赛的数据出发,建立一款足球预测的系统模型,并将该系统开放,有需求的可自行获取。

足球预测模型系统    提取码:fz0o

研究成果

1.数据预处理

对于数据对象,这里选用的是五大联赛2000赛季至2017赛季的场均进球数,数据统计图表如下图所示,数值保留两位小数:

2.离群点的校验

离群点指的是在单位时间序列中,远离序列一般水平的极端大值与极端小值。而同时,离群点的形成原因,也就是系统外部干扰是多种多样的,为了克服这一问题,这里对五大联赛共17个赛季的场均进球进行了探索性分析,检验其中的离群点,以期提高模型预测准确度。
如下图所示,德甲、西甲、意甲存在离群点现象,而法甲、英超并没有。

模型识别

1.序列图

根据数据统计可以得出,五大联赛的场均进球数随着时间推移而展现起初下降后续逐步上升的趋势,如下图所示:

2.自相关和偏相关分析

为了抱我五大联赛的进球特点,此处通过自相关系数(ACF)、偏自相关系数(PACF)分析图进一步识别模型和目标序列定阶,同时使用SPSS对数据进行自相关分析,如下图所示:

从总体上来看,伴随着延迟树木的增加,自相关系数并未显著趋于0,并且近一般数值位于置信区之外,与此同时,偏自相关的系数也随之逐渐减弱,说明该时间序列并非平稳。为了更好确认数据的平稳性,对原始数据进行1阶拆分处理,得到自相关系数、偏自相关系数大多进入置信区间。

3.假设检验

假设H0:原始世界序列Xi平稳,H1:序列Xi不平稳,采用显著性格水平α=0.05进行检验。
按照下图来看,原始数据P<0.01,具备较强显著性差异,则拒绝H0假设接收H1假设,证明该序列不平稳;进行1阶差分后。P>0.05,相反则接收H0假设判定该数列为平稳序列,且数值逐渐增大总体趋势为上升,与序列图分析一致。

模型构建

五大联赛模型结果参数如下图所示:

预测模型系统化效果展示

预测概率80%浮动

将上述参数模型进行训练迭代,并引入泊松分布、蒙特卡洛、贝叶斯等方法后,预测模型的准确率已初见成效,同时预测范围不再局限于五大联赛,现今也包括了欧洲杯、欧冠杯、瑞典超等等,预测结果如下图所示,11场比赛经由模型预测后全部正确。

拓展模块:赛事盘监控

为了进一步提升预测的准确度,系统增添了赛事监控模块,该功能可对赛事情况进行监控,及时观察到比赛比分、让球、大球数据的变动,以及盘的掉水升盘情况,根据掉水升盘情况,我们就能得出比赛接下来的进球趋势。

总结

足球学具备技能以及命中的双重数学,这项特征决定了进球时多种战术协同作用的结果,在足球规则提倡进攻的情况下,场均进球较少,则有稳定增加的趋势,符合足球项目的发展规律。同时,该模型的预测适用于短期预测,同时也更有利于长期预测,进球序列上,你和只和观察值曲线在整个区间整体上拟合情况良好。

现将该预测模型系统分享,有需求的可自行下载:
足球预测模型系统 
提取码:fz0o

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值