无敌叉烧包z-CSDN博客

原创 jane street market prediction 冠军方案经验分享（1/3）

分享jane street比赛如何夺取冠军

2021-03-08 20:11:37 3357 5

原创分布式部署lightgbm总结

Lightgbmaws– LightGBM 算法框架运行在Amazon Sagemaker :https://aws.amazon.com/cn/blogs/china/the-lightgbm-algorithm-framework-runs-on-amazon-sagemaker/– https://docs.aws.amazon.com/search/doc-search.html?searchPath=documentation&searchQuery=lightgbmXgb

2024-06-14 19:59:37 252

原创大模型训练，高效低成本打乱shuffle数据的新算法

高效进行数据shuffle

2024-01-18 19:30:02 632

原创 ATEC“数星”计划发布，开源亿级工业数据集

清华大学教授、计算机系副系主任、ATEC前沿科技探索社区发起人徐恪，清华大学网络科学与网络空间研究院副教授、ATEC2022评审委员会主席李琦，蚂蚁集团副总裁王志荣，蚂蚁集团商业营销技术部总监莫林剑，蚂蚁集团技术战略发展部技术运营部总监、ATEC前沿科技探索计划发起人宋宠，蚂蚁集团机器智能部技术总监、ATEC2022赛题组负责人张志强等嘉宾共同出席了“数星”计划发布仪式。该数据集在遵循国家法律法规及个人隐私保护的前提下，为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。

2023-10-13 13:37:06 359

原创 kaggle Optiver - Trading at the Close Baseline模型分享

2023 kaggle optiver competitionOptiver - Trading at the Close

2023-09-23 11:26:11 16413 41

原创用一个问题探索构造因子的思路方向（chatgpt大模型）

用chatgpt挖因子

2023-09-21 17:04:22 603 1

原创第六届全国工业互联网数据创新应用大赛 (双赛道季军)

虽然融合了很多模型，但是最终榜单的分数抖动很大，基本上翻倍了，分数受到少数异常样本的影响很大，基本上就是看谁的随机种子更好了。最后选择模型的时候没有选择a榜分数第一的模型，虽然通过分析发现了ab很可能榜存在联系，但是没想到最后ab榜数据几乎一致。

2023-05-19 16:47:06 562 1

原创 world quant global alphathon 全球总决赛中国区冠军全球亚军经验分享

world quant global alphathon 世坤全球因子大赛alpha101 101个alpha wq

2022-10-25 21:24:52 5001 1

原创 Kaggle Ubiquant Market Prediction 公榜前4（私榜目前1000+）方案 (慢更)

kaggle ubiquant market prediction 比赛方案详解

2022-04-05 13:40:31 6345 18

原创第五届全国工业互联网数据创新应用大赛短期风况预测 (双赛道亚军)

赛题背景近年来随着陆上风电机组装机厂址的扩展，在天气突变较多的地区安装的风力发电机组受到气象变化的影响愈发显著。在风况突变时，由于控制系统的滞后性，容易导致机组出现载荷过大，甚至是倒机的情况，造成重大近年来随着陆上风电机组装机厂址的扩展，在天气突变较多的地区安装的风力发电机组受到气象变化的影响愈发显著。在风况突变时，由于控制系统的滞后性，容易导致机组出现载荷过大，甚至是倒机的情况，造成重大经济损失。同时，现有超短期风功率预测的准确性较差，导致风功率预测系统对电网调度的参考价值不大，并且会导致业主产生大量的

2022-01-08 20:08:09 2106

原创基于AI的信道信息反馈性能提升一个trick干到381bit（rank8）

目录前言模型架构前言比赛链接：基于AI的信道信息反馈性能提升这场比赛是为了学习AutoEncoder而参加的比赛，主要是为了辅助Jane Street 比赛中的一个方案。另一方面这个比赛奖金比较丰厚，5G也是先进技术研究的热点方向，个人比较感兴趣。比赛最后一天改了代码，导致模型过拟合了，有点可惜。参加赛后分享，貌似前三的队伍都不是纯模型方案了，也算是学习了一种思路吧，不能把目光局限于端到端一把梭。模型架构...

2021-03-31 21:39:10 1017

原创从零开始学bert，预训练实战笔记(torch版本)

目录序言预训练定义tokenizer定义预训练模型的参数开始预训练finetune微调bert模型定义模型定义dataset定义训练过程结论序言BERT是2018年10月由Google AI研究院提出的一种预训练模型。当时它在11中不同的NLP任务中取得了SOTA结果。我第二次参加的正式比赛是腾讯广告算法大赛，本来这个比赛是一个学习使用bert的很好的机会，但是由于比赛中LSTM展现出了优于transformer的表现，于是最终的模型选择了LSTM，也因为错过了学习bert的机会。前几天为了试一试be

2021-03-13 02:10:21 3664 7

原创 jane street market prediction 冠军方案奇巧淫技与topline链接整理（3/3）

目录前言将income 作为loss(优化目标)读取数据，定义优化目标模型训练与微调提交结果多目标学习Topline整理AE+MLP (rank10)Current 17th solution: Ensembles of deep (49 layer) MLPsmixup augmentation: a way to learn from trades with weight=0 （rank4）My (perhaps) over-complicated LSTM solutionCurrent 62nd .

2021-03-10 16:04:50 1579 4

原创 jane street market prediction 冠军方案经验分享，代码部分（2/3）

目录XGBOOST模型载入依赖读取数据压缩数据集设置训练集与标签XGBOOST模型与训练输出结果比赛链接：Jane Street Market PredictionXGBOOST模型这里介绍比赛中用到的XGBOOST模型。模型的超参参考了这个notebook，额外加入了l1, l2正则化，注意到正则化在线上线下都能够带来提升（上分点）。载入依赖import numpy as np # linear algebraimport pandas as pd # data processing, CS.

2021-03-09 20:48:28 2141 4

原创 BOOKING Challenge Rank3 方案分享(付代码实现)

BOOKING Challenge Rank3 方案分享欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入BOOKINGCHALLENGE是bookings.com在这里发起的旅游目的地推荐比赛

2021-03-01 01:21:55 549 1

weixin_51484067的博客