kaggle时间序列竞赛top方案汇总

37 篇文章 6 订阅
15 篇文章 2 订阅

时间序列预测作为机器学习中的一项常见的任务,应用场景非常广泛,比如电力能源、交通流量、股票价格、天气变化、疾病等预测,在各个领域中都具有非常重要的作用。

我们遇到的很多预测问题其实都能看作是时序预测问题,在数据挖掘竞赛中,时间序列预测相关的竞赛也占了相当大的一部分。

今天我就帮同学们整理了kaggle时间序列预测相关的比赛,新赛经典赛都有,各场比赛的top方案也分享了,有需要的同学可以收藏一下~

上次分享的是kaggle金融量化竞赛的top方案,感兴趣的同学点蓝字传送。

1.蛋白功能预测大赛

比赛链接:CAFA 5 Protein Function Prediction | Kaggle

比赛背景:该竞赛的目标是预测一组蛋白质的功能。参赛者将开发一个针对蛋白质的氨基酸序列和其他数据进行训练的模型。参赛者的工作将帮助研究人员更好地了解蛋白质的功能,这对于发现细胞,组织和器官如何工作非常重要。这也可能有助于开发针对各种疾病的新药和疗法。

评估标准:提交将对在提交截止日期之前在基因本体(GO)的至少一个子本体中没有实验确定的功能注释的蛋白质(测试集)进行评估,并且在提交截止日期和评估时间之间在该子本体中积累了经过实验验证的功能注释。

比赛时间:2023.4-2023.8

金牌方案:

竞赛尚未结束,排名出了会更新在这里

8月21日截止投稿,想要金牌的同学加油冲!

2.Stable Diffusion 大赛

​比赛链接:Stable Diffusion - Image to Prompts | Kaggle

比赛背景:竞赛的目标是逆转典型的生成式文本到图像模型的方向:不是根据文本提示生成图像,而是参赛者能创建一个模型,给定生成的图像后能预测文本提示。参赛者将在包含由 Stable Diffusion 2.0 生成的各种各样的“(提示,图像)”对的数据集上进行预测,以了解潜在关系的可逆性有多强。

评估标准:提交的评估使用预测提示嵌入向量和实际提示嵌入向量之间的平均余弦相似度得分。

比赛时间:2023.2-2023.5

金牌方案:

第一名:Stable Diffusion - Image to Prompts | Kaggle

第二名:Stable Diffusion - Image to Prompts | Kaggle

第三名:Stable Diffusion - Image to Prompts | Kaggle

第四名:Stable Diffusion - Image to Prompts | Kaggle

第五名:Stable Diffusion - Image to Prompts | Kaggle

第六名:Stable Diffusion - Image to Prompts | Kaggle

第七名:Stable Diffusion - Image to Prompts | Kaggle

第十一名:Stable Diffusion - Image to Prompts | Kaggle

第十二名:Stable Diffusion - Image to Prompts | Kaggle

3.微型企业密度预测大赛

比赛链接:GoDaddy - Microbusiness Density Forecasting | Kaggle

比赛背景:本次竞赛的目标是预测给定地区的每月微型企业密度。参赛者将开发一个针对美国县级数据训练的准确模型。参赛者的工作将帮助政策制定者了解微型企业,这是非常小实体的增长趋势。更多信息将使新的政策和计划能够提高这些最小企业的成功和影响。

评估标准:提交的评估使用预测值和实际值之间的对称平均绝对百分比误差(SMAPE)。当预测值和实际值同时为0时,我们定义SMAPE为0。

比赛时间:2022.12-2023.3

金牌方案:

第一名:GoDaddy - Microbusiness Density Forecasting | Kaggle

第二名:GoDaddy - Microbusiness Density Forecasting | Kaggle

第三名:GoDaddy - Microbusiness Density Forecasting | Kaggle

第四名:GoDaddy - Microbusiness Density Forecasting | Kaggle

第六名:GoDaddy - Microbusiness Density Forecasting | Kaggle

第十名:GoDaddy - Microbusiness Density Forecasting | Kaggle

第十一名:GoDaddy - Microbusiness Density Forecasting | Kaggle

4.股票市场波动率预测大赛

​比赛链接:Optiver Realized Volatility Prediction | Kaggle

比赛背景:在这个比赛的前三个月中,参赛者将构建模型来预测跨不同行业的数百只股票的短期波动率。参赛者可以获取数亿行高度细致的金融数据,用这些数据设计模型来预测10分钟周期内的波动率。参赛者的模型将在训练后的数据集的三个月评估期内与真实的市场数据进行评估。通过这个比赛,参赛者将对波动率和金融市场结构有宝贵的洞见。

评估标准:提交的评估使用均方根百分比误差(RMSPE),定义为:

​比赛时间:2021.6-2022.1

金牌方案:

第一名:Optiver Realized Volatility Prediction | Kaggle

第三名:Optiver Realized Volatility Prediction | Kaggle

第七名:Optiver Realized Volatility Prediction | Kaggle

5.简街市场预测大赛

​比赛链接:https://www.kaggle.com/competitions/jane-street-market-prediction/overview

比赛背景:在一个完全有效的市场中,买家和卖家将拥有做出理易决策所需的所有代理和信息。因此,产品将始终保持其“公允价值”,永远不会被低估或定价过高。然而,金融市场在现实世界中并不完全有效。

制定交易策略以识别和利用低效率是具有挑战性的。即使一种策略现在有利可图,也可能在未来不会,市场波动使得无法确定地预测任何给定交易的盈利能力。因此,很难将好运气与做出良好的交易决定区分开来。

在此挑战中,参赛者将建立自己的量化交易模型,以使用来自全球主要证券交易所的市场数据最大化回报。

评估标准:该竞赛根据效用分数进行评估。

比赛时间:2021.2-2021.8

金牌方案:

第一名:https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/224348

第三名:https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/224713

第十名:https://www.kaggle.com/competitions/jane-street-market-prediction/discussion/226837

6.M5预测-不确定性大赛

​比赛链接:M5 Forecasting - Uncertainty | Kaggle

比赛背景:在本次竞赛(第五次迭代)中,参赛者将使用全球收入最大的公司沃尔玛的分层销售数据来预测未来 28 天的每日销售额,并为这些预测进行不确定性估计。该数据涵盖美国三个州(加利福尼亚州、德克萨斯州和威斯康星州)的商店,包括项目级别、部门、产品类别和商店详细信息。此外,它还具有解释变量,例如价格、促销、星期几和特殊事件。总之,这个强大的数据集可用于提高预测准确性。

如果成功,参赛者的工作将继续推进预测的理论和实践。所使用的方法可以应用于各种业务领域。

评估标准:本次比赛使用加权缩放弹球损失(WSPL)。

比赛时间:2020.6.1-2020.6.23

金牌方案:

第二名:M5 Forecasting - Uncertainty | Kaggle

第三名:M5 Forecasting - Uncertainty | Kaggle

第五名:M5 Forecasting - Uncertainty | Kaggle

第六名:M5 Forecasting - Uncertainty | Kaggle

第十名:M5 Forecasting - Uncertainty | Kaggle

第十一名:M5 Forecasting - Uncertainty | Kaggle

7.M5时间序列预测大赛

​比赛链接:M5 Forecasting - Accuracy | Kaggle

比赛背景:在本次竞赛(第五次迭代)中,参赛者将使用全球收入最大的公司沃尔玛的分层销售数据来预测未来 28 天的每日销售额。该数据涵盖美国三个州(加利福尼亚州、德克萨斯州和威斯康星州)的商店,包括项目级别、部门、产品类别和商店详细信息。此外,它还具有解释变量,例如价格、促销、星期几和特殊事件。总之,这个强大的数据集可用于提高预测准确性。

如果成功,参赛者的工作将继续推进预测的理论和实践,所使用的方法可以应用于各种业务领域。

评估标准:本次竞赛使用加权均方根缩放误差(RMSSE)。

比赛时间:2020.6.1-2020.6.30

金牌方案:

第一名:M5 Forecasting - Accuracy | Kaggle

第二名:M5 Forecasting - Accuracy | Kaggle

第三名:M5 Forecasting - Accuracy | Kaggle

第四名:M5 Forecasting - Accuracy | Kaggle

第五名:M5 Forecasting - Accuracy | Kaggle

第七名:M5 Forecasting - Accuracy | Kaggle

第十四名:M5 Forecasting - Accuracy | Kaggle

第十六名:M5 Forecasting - Accuracy | Kaggle

第二十一名:M5 Forecasting - Accuracy | Kaggle

8.餐厅人流预测大赛

​比赛链接:Recruit Restaurant Visitor Forecasting | Kaggle

比赛背景:一个常见的困境是,餐馆需要知道每天有多少顾客可以有效地购买食材并安排员工。这个预测并不容易做出,因为许多不可预测的因素会影响餐厅的出勤率,比如天气和当地竞争。对于历史数据很少的新餐厅来说,这更难。

在本次竞赛中,参赛者面临的挑战是使用预订和访问数据来预测未来日期餐厅的访客总数。这些信息将帮助餐厅提高效率,并使他们能够专注于为顾客创造愉快的用餐体验。

评估标准:提交内容根据均方根对数误差进行评估。RMSLE 的计算公式为:

​比赛时间:2018.1-2018.2

金牌方案:

第一名:Recruit Restaurant Visitor Forecasting | Kaggle

第七名:Recruit Restaurant Visitor Forecasting | Kaggle

第八名:Recruit Restaurant Visitor Forecasting | Kaggle

第十名:Recruit Restaurant Visitor Forecasting | Kaggle

第十一名:Recruit Restaurant Visitor Forecasting | Kaggle

第十二名:Recruit Restaurant Visitor Forecasting | Kaggle

9.预测商品销量大赛

​比赛链接:Predict Future Sales | Kaggle

比赛背景:在本次比赛中,参赛者将使用一个具有挑战性的时间序列数据集,该数据集由俄罗斯最大的软件公司之一 - 1C Company提供,由每日销售数据组成。

我们要求参赛者预测下个月每种产品和商店的总销售额。通过解决这个竞赛,参赛者将能够应用和提高你的数据科学技能。

评估标准:提交通过均方根误差 (RMSE)进行评估。真正的目标值被裁剪到 [0,20] 范围内。

比赛时间:a year to go

金牌方案:尚未结束

10.实体店销售 - 时序预测大赛

​比赛链接:Store Sales - Time Series Forecasting | Kaggle

比赛背景:在此“入门”竞赛中,参赛者将使用时间序列预测来预测来自厄瓜多尔大型杂货零售商 Corporación Favorita 的数据的商店销售额。

具体而言,参赛者将构建一个模型,该模型可以更准确地预测在不同 Favorita 商店销售的数千种商品的单位销售额。参赛者将使用包含日期、商店和商品信息、促销和单位销售的平易近人的训练数据集来练习机器学习技能。

评估标准:本次竞赛的评估指标是均方根对数误差。

比赛时间:Ongoing

11.杂货销售预测大赛

​比赛链接:Corporación Favorita Grocery Sales Forecasting | Kaggle

比赛背景:Corporación Favorita向 Kaggle 社区提出了挑战,要求他们建立一个更准确地预测产品销售的模型。他们目前依赖于主观预测方法,几乎没有数据支持,执行计划的自动化也很少。他们很高兴看到机器学习如何通过在正确的时间提供足够的正确产品来更好地确保他们取悦客户。

评估标准:提交内容根据归一化加权均方根对数误差 (NWRMSLE) 进行评估。

比赛时间:2018.1.8-2018.1.15

金牌方案:

第一名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第二名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第三名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第四名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第五名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第六名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第八名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第十二名:Corporación Favorita Grocery Sales Forecasting | Kaggle

第十三名:Corporación Favorita Grocery Sales Forecasting | Kaggle

 关注下方《学姐带你玩AI》🚀🚀🚀

回复“时间序列”免费领取baseline代码合集

码字不易,欢迎大家点赞评论收藏!

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值