DolphinScheduler 机器学习工作流预测今年 FIFA 世界杯冠军大概率是荷兰!

7138c0191c585626f7ade3fdf357837e.gif

点击蓝字,关注我们

33fd68cb7d3b34cdb4bce1c9ce5bca65.jpeg

作者 | DolphinScheduler Committer 周捷光

2022 FIFA 世界杯火热进行中!这段时间,这场盛宴吸引了全球球迷的目光。除了让人心跳加快的赛况和被大家调侃像馄饨皮的吉祥物之外,预测和投注哪支队伍将会夺冠绝对是球迷最大的乐趣之一。

我也是众多想要知道今年谁会夺冠的球迷之一。想到就要去做!于是我花了 2 天时间,用 DolphinScheduler 制作了一个机器学习预测模型来预测 2022 年 FIFA 世界杯的冠军,而且每天能获得一个 betting_stratrgy。

这个事情并不复杂,实际上只需要 3 个步骤就可以完成预测,我把实现的过程在 GitHub 上分享出来了:https://github.com/jieguangzhou/FIFA-World-Cup-2022/tree/master

这是我的预测结果:

cd0f8f6fd9d17cf457a10263e0998291.png

我还录制了一个视频来解释整个工作的过程和原理,希望能帮助你享受这场体育盛宴,或者只是娱乐一下:)

视频口误纠正:41s 处应为“塞尔维亚获胜的几率”,12:15s 处应为“葡萄牙 vs. 加纳”。

视频中演示所用的 GitHub 地址:https://github.com/jieguangzhou/FIFA-World-Cup-2022/tree/master

下面是这个项目的具体实现方法,感兴趣的朋友不妨试试。

70cba07fc6c2082a8d5671dc8a157696.gif

赛事播报

世界杯冠军预测

使用两种不同预测方法的结果:

1. 基于球队获胜概率模拟 1000 次世界杯预选赛结果

获得冠军的概率

f32c9348ba3bc023d945e3dbf21b1889.png

前四名

4d8069b96fefa1d8bf5d38e7646e2a88.png

2. 选择获胜概率高的球队

b74ae59c92d37ca8fcf864daa3be8459.png

所有比赛结果可在以下两个文件中查看

  • https://github.com/jieguangzhou/FIFA-World-Cup-2022/blob/workflow-pro/results/predict.txt

  • https://github.com/jieguangzhou/FIFA-World-Cup-2022/blob/workflow-pro/results/results.csv

以上结果来自分支 workflow-pro。该分支将训练更长的模型并运行更多次的模拟比赛。

7e15f572510341f427f03fba8a97bfe5.gif

赛事播报

我是如何建立这个模型的?

1

三步构建预测系统

  • Step-1 启动 DolphinScheduler

我们可以使用 Docker 启动 Dolphinscheduler 独立服务

docker run --name dolphinscheduler-standalone-server -p 12345:12345 -p 25333:25333 -d jalonzjg/dolphinscheduler-fifa

如果没有安装 Doker,可到 https://www.docker.com/ 下载

接着,你可以在 http://localhost:12345/dolphinscheduler/ui 登录 DolphinScheduler

用户:admin 密码:dolphinscheduler123

9232db8514121cf782efa1b74c11fe7e.png

  • Step-2 提交流程

python3 -m pip install apache-dolphinscheduler==3.1.1
export PYDS_HOME=./
python3 pyds.py

您可以单击Project -> FIFA

da45a2315c4bfaf3e659805401b9d981.png

然后,我们可以看到 2 个工作流程

  • training:使用 FLAML 训练模型

  • predict:使用模型预测哪个国家会赢得世界杯

52b47344669651f4afd6c8ff879398eb.png

  • Step-3 运行工作流

    • 开始训练工作流程

8fb76a2eef72e87de203cce258f38272.png

我们可以在工作流完成后查看日志。

8f78dbde7d48eebf8fd2fae9316a05ca.png

    • 开启预测工作流

工作流完成后可查看日志。

b18679d8c7dd1dff0c0cf660af228617.png

2

赛事时间表

附上比赛时间表,看球愉快!

371ab4019eb46729be20d3bb559cb090.png

你觉得这个预测符合你的预期吗?哪支球队将赢得最后一场比赛,请在下方投票!⚽️⚽️⚽️

ff40dd3dca4a078eaf721f1a3203d1d9.gif

赛事播报

加入社区

对 Apache DolphinScheduler 感兴趣的朋友,欢迎添加小助手(Leonard-ds)加入社区交流群!

fdc4b3dd2bc4df08734b9312f50fbd57.jpeg

a3cafdf1f3c7f9898572453c59ffdc04.png 加入 Slack:https://bit.ly/dolphinscheduler

6d3c964fd4978ae6f68a928c82e4f649.gif

赛事播报

参与贡献

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

d338898a01576db6a60e65f37bab2e95.png

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

< 🐬🐬 >

活动推荐

dde7cf57a466a2f624e9fea56928ce06.png

海豚调度&Linkis强强结合

探索计算治理难题的终极密码

2022 年 12 月 1 晚 20:00-21:30,Apache DolphinScheduler&Apache Linkis(Incubating) 线上Meetup活动即将来袭!来自DolphinScheduler和Linkis社区的核心贡献者将带来两个项目整合的技术分享,聚焦解决计算治理难题的方法,干货满满,欢迎报名参加!

预约报名

点击阅读原文报名!

我知道你在看919d7ac9e8cc7684da5c392f323f3204.png

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DolphinScheduler社区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值