Kaggle TOP1：神奇的时序Trick直接炸榜

搜狐技术产品小编2023

于 2021-07-22 07:30:00 发布

阅读量7.6k

点赞数 1

文章标签：算法人工智能机器学习深度学习区块链

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SOHU_TECH/article/details/119013551

版权

本文介绍了Kaggle Jane Street Market Prediction竞赛的第一名策略，通过结合机器学习（如XGB+MLP）和深入的数据分析，特别是利用resp_3来优化交易收益。文中强调了理解数据模式、避免过拟合以及关注模型稳定性和收益的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文字数：2971字

预计阅读时间：18分钟

作者介绍

王明杰，北京师范大学珠海校区研究助理。2021年搜狐校园文本匹配算法大赛第二名获得者，曾在Kaggle、天池等国际算法大赛获得优异成绩：

• Kaggle Jane Street Market Prediction TOP1

• Kaggle Mechanisms of Action (MoA) Prediction 银牌

• Kaggle SIIM-ISIC Melanoma Classification 银牌

本篇文章是明杰同学参加Kaggle Jane Street Market Predictio的竞赛总结，希望通过此次技术分享为各位同学提供些许算法思路，并在其他竞赛中取得更好成绩:)

#1

今天的贸易系统在很大程度上依赖于技术的运用。市场每天都在运作，为了在这种动态的市场中生存下去，我们需要使用所有有用的东西。机器学习模型就是一个十分出色的选择。因为它非常善于理解模式和预测，并且随着技术的发展，机器学习在市场价格预测中的应用越来越多。结合机器学习模型和人类知识可以做到十分出色的市场预测。

#2

在Kaggle Jane Street Market Prediction里，我们需要使用来自全球主要的证券交易所的市场数据构建量化交易模型，并且在真实的未来数据上测试我们的模型性能。

该数据集包含一组匿名特征feature_{0...129}，对于数据与标签我们都不知道它们代表了什么含义。我们只知道，它们代表真实的股票市场数据。

数据集中的每一行代表一个交易，我们将为其预测一个action值：1 表示进行交易，0 表示不进行交易。每笔交易都有一个关联的weight和resp，它们组合在一起代表了交易的回报率。该date列是一个整数，代表交易日。

#3

比赛的metrics为Utility Score：

Pi代表了每一天的收入；

weight是购买stock的数量；

resp是未来交易时的价格浮动；

action 则代表是否进行这次交易。

值得注意的是，比赛中存在很严重的过拟合公榜的现象，很多人发布了针对公榜调参的模型。最终在私榜上的抖动还是比较严重的，但是可以发现公榜和私榜存在线性相关。

简单数据格式如下：

这是我们队伍最终获得的成绩：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。