基于决策树算法建立足球预测模型,成绩令人惊讶

前言

自从大数据时代开启,昔日许多的难题都变得简单化了,这不仅让我好奇足球预测是否也是如此,于是和几个志同道合的朋友们一起,以决策树算法为基础建立了一份足球预测模型系统,经过几年技术迭代系统升级后如今预测成绩也是相当可以了,近期预测战绩如下:

此模型建立的足球预测系统就先放在这了,感兴趣的朋友可以试试看:
足球预测系统   提取码:fz0o 

除此之外还有比分预测、角球预测等等,不过这都是后话了,这里将我建立模型的部分心得写下来,希望能对各位有所启发。

整体设计理念

对于足球分析预测系统来说,它首先应该是一个可以独立运行的,自动获取更新比赛各类信息,并且由此来更新预测算法,生成预测结果的系统。

足球赛事预测模型

球队进球率模型

若要反映球队的进攻实力数据,进球率无疑是最好的写照,其计算公式为:

进球率=总进球数/总比赛场数

获得交战双方的进球率后,便可对两队进球率相减,得到进球率值差,这在很大程度上可以意味着球队胜负的走势。

球队积分模型

球队积分客观反映了球队的成绩,而近几轮的球队积分则是球队近期的状态很好的体现。其中,球队近五轮的积分越高,则说明该球队状态越好,下轮比赛胜率也就越高,为了反应比赛真是状态,还需添加球队的胜率权重,其胜率的信息增益率和近五轮积分关系如下图所示:

不难看出,当近五轮积分达到10时,信息增益率达到峰值。对于胜率来说,也呈现相似趋势,但胜率达53%时,信息增益率也达到峰值,如下图所示:

数据挖掘C4.5算法及其应用

C4.5算法简介

C4.5算法的实质就是由样本集生成决策树的过程。该算法生成了一个决策树形式的分类器;决策树是具有两类节点的结构;叶节点表示一个类;决策节点指定要在单个属性值上进行的检验,对检验的每个可能输出都有一个分支和子树。

C4.5预测模型

基于上述两个数据模型,可以得到一个数据集,包含进球率和近五轮积分两个属性,通过C4.5算法,可以将这个数据集作为基础生成决策树,去除极端情况,该决策树分布图如下:

足球结果分析预测

对数据集使用C4.5算法生成决策树后,系统可以获得一个大致的胜负分析标准,若具化在二维坐标系中,可以理解成一个范围。

对于待分析预测的比赛,先计算出比赛的进球率和胜利指数!根据数值分布分别处理,在描述处理步骤之前,再次声明一下所需要用到的参数。

将分析失败却胜利的数据占所有分析失败数据的比例为L;分析胜利结果失败的数据占所有胜率数据的比例设为W;划分胜利边界的焦点为A(X1,Y1);划分失败边界的交点B(X2,Y2);点A点B的中点为点C(X3,Y3);该数据为点D(X4,Y4),设胜利权重为W1,平局权重为W2,失败权重为W3;S=W1+W2+W3。

对于分布在胜利的数据处理:

对于分布在失败的数据的处理:

对于分布在胜利或失败范围之外的数据处理:

最初版本实验数据系统

在实现系统应用的基础上,系统基于历史比赛数据对足球比赛的分析的结果,也与真实结果较为相似,初代系统如下图所示:

可以看出足球比赛的胜负确实存在一定程度的规律,但也并非没有例外的出现,因此对足球胜负的预测现今是难以做到百分之百的准确的。

现版本足球预测系统

八成预测准确率

初代版本的预测系统仅使用了决策树算法,经过多年的技术迭代后,现版本预测系统还参照了泊松分布、蒙特卡洛、贝叶斯、ELO、机器学习算法等技术,预测准确率也得到了进一步提升,目前综合预测准确率已趋于80%,近期预测战绩如下:

赛事监控模块

除了预测技术的更新之外,现版本还新添了赛事监控模块,该模块能对比赛进行实时监控,根据UWB技术,系统能够实时监控比分、让球、大球的变化,还能及时查看盘口掉水。升盘情况的变动,并对此进行提醒,对于老球迷们来说,根据这些信息可以进一步的提升胜率,例如:当没有进球的情况下,监控多次提示10分钟盘口不变,那么就说明接下来进球的概率会得到提升。

总结

本文基于大数据时代的热潮,以决策树算法作为基底根据数据挖掘建立了一项足球预测系统,并随着后续技术迭代逐步引入了泊松分布、蒙特卡洛、ELO、贝叶斯、机器学习算法等,现足球预测率已达到80%左右,并且不仅是进球预测和胜平负预测,还建立了比分预测和角球数预测模型,感兴趣的可以来详细了解。

系统分享 
提取码:fz0o

  • 18
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值