自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 jane street market prediction 冠军方案 经验分享 (1/3)

分享jane street比赛如何夺取冠军

2021-03-08 20:11:37 3357 5

原创 分布式部署lightgbm总结

Lightgbmaws– LightGBM 算法框架运行在Amazon Sagemaker :https://aws.amazon.com/cn/blogs/china/the-lightgbm-algorithm-framework-runs-on-amazon-sagemaker/– https://docs.aws.amazon.com/search/doc-search.html?searchPath=documentation&searchQuery=lightgbmXgb

2024-06-14 19:59:37 252

原创 大模型训练,高效低成本打乱shuffle数据的新算法

高效进行数据shuffle

2024-01-18 19:30:02 632

原创 ATEC“数星”计划发布,开源亿级工业数据集

清华大学教授、计算机系副系主任、ATEC前沿科技探索社区发起人徐恪,清华大学网络科学与网络空间研究院副教授、ATEC2022评审委员会主席李琦,蚂蚁集团副总裁王志荣,蚂蚁集团商业营销技术部总监莫林剑,蚂蚁集团技术战略发展部技术运营部总监、ATEC前沿科技探索计划发起人宋宠,蚂蚁集团机器智能部技术总监、ATEC2022赛题组负责人张志强等嘉宾共同出席了“数星”计划发布仪式。该数据集在遵循国家法律法规及个人隐私保护的前提下,为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。

2023-10-13 13:37:06 359

原创 kaggle Optiver - Trading at the Close Baseline模型分享

2023 kaggle optiver competitionOptiver - Trading at the Close

2023-09-23 11:26:11 16413 41

原创 用一个问题探索构造因子的思路方向(chatgpt大模型)

用chatgpt挖因子

2023-09-21 17:04:22 603 1

原创 第六届全国工业互联网数据创新应用大赛 (双赛道 季军)

虽然融合了很多模型,但是最终榜单的分数抖动很大,基本上翻倍了,分数受到少数异常样本的影响很大,基本上就是看谁的随机种子更好了。最后选择模型的时候没有选择a榜分数第一的模型,虽然通过分析发现了ab很可能榜存在联系,但是没想到最后ab榜数据几乎一致。

2023-05-19 16:47:06 562 1

原创 world quant global alphathon 全球总决赛 中国区冠军 全球亚军经验分享

world quant global alphathon 世坤全球因子大赛alpha101 101个alpha wq

2022-10-25 21:24:52 5001 1

原创 Kaggle Ubiquant Market Prediction 公榜前4(私榜目前1000+)方案 (慢更)

kaggle ubiquant market prediction 比赛方案详解

2022-04-05 13:40:31 6345 18

原创 第五届全国工业互联网数据创新应用大赛 短期风况预测 (双赛道 亚军)

赛题背景近年来随着陆上风电机组装机厂址的扩展,在天气突变较多的地区安装的风力发电机组受到气象变化的影响愈发显著。在风况突变时,由于控制系统的滞后性,容易导致机组出现载荷过大,甚至是倒机的情况,造成重大近年来随着陆上风电机组装机厂址的扩展,在天气突变较多的地区安装的风力发电机组受到气象变化的影响愈发显著。在风况突变时,由于控制系统的滞后性,容易导致机组出现载荷过大,甚至是倒机的情况,造成重大经济损失。同时,现有超短期风功率预测的准确性较差,导致风功率预测系统对电网调度的参考价值不大,并且会导致业主产生大量的

2022-01-08 20:08:09 2106

原创 基于AI的信道信息反馈性能提升 一个trick干到381bit(rank8)

目录前言模型架构前言比赛链接:基于AI的信道信息反馈性能提升这场比赛是为了学习AutoEncoder而参加的比赛,主要是为了辅助Jane Street 比赛中的一个方案。另一方面这个比赛奖金比较丰厚,5G也是先进技术研究的热点方向,个人比较感兴趣。比赛最后一天改了代码,导致模型过拟合了,有点可惜。参加赛后分享,貌似前三的队伍都不是纯模型方案了,也算是学习了一种思路吧,不能把目光局限于端到端一把梭。模型架构...

2021-03-31 21:39:10 1017

原创 从零开始学bert,预训练实战笔记(torch版本)

目录序言预训练定义tokenizer定义预训练模型的参数开始预训练finetune微调bert模型定义模型定义dataset定义训练过程结论序言BERT是2018年10月由Google AI研究院提出的一种预训练模型。当时它在11中不同的NLP任务中取得了SOTA结果。我第二次参加的正式比赛是腾讯广告算法大赛,本来这个比赛是一个学习使用bert的很好的机会,但是由于比赛中LSTM展现出了优于transformer的表现,于是最终的模型选择了LSTM,也因为错过了学习bert的机会。前几天为了试一试be

2021-03-13 02:10:21 3664 7

原创 jane street market prediction 冠军方案 奇巧淫技与topline链接整理(3/3)

目录前言将income 作为loss(优化目标)读取数据,定义优化目标模型训练与微调提交结果多目标学习Topline整理AE+MLP (rank10)Current 17th solution: Ensembles of deep (49 layer) MLPsmixup augmentation: a way to learn from trades with weight=0 (rank4)My (perhaps) over-complicated LSTM solutionCurrent 62nd .

2021-03-10 16:04:50 1579 4

原创 jane street market prediction 冠军方案 经验分享,代码部分 (2/3)

目录XGBOOST模型载入依赖读取数据压缩数据集设置训练集与标签XGBOOST模型与训练输出结果比赛链接:Jane Street Market PredictionXGBOOST模型这里介绍比赛中用到的XGBOOST模型。模型的超参参考了这个notebook,额外加入了l1, l2正则化,注意到正则化在线上线下都能够带来提升(上分点)。载入依赖import numpy as np # linear algebraimport pandas as pd # data processing, CS.

2021-03-09 20:48:28 2141 4

原创 BOOKING Challenge Rank3 方案分享(付代码实现)

BOOKING Challenge Rank3 方案分享欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入BOOKINGCHALLENGE是bookings.com在这里发起的旅游目的地推荐比赛

2021-03-01 01:21:55 549 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除