用Qlib模拟实战中机器学习多因子预测的流程：必须滚动预测

扫地僧量化

已于 2023-12-28 11:10:28 修改

阅读量841

点赞数 11

分类专栏：扫地僧Qlib量化平台系列文章标签： qlib backtrader 量化交易 vnpy 量化投资 ai量化投资机器学习量化

于 2023-12-28 10:24:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qtbgo/article/details/135262793

版权

绝大多数同学学习qlib，是从qlib提供的基本案例workflow_by_code.ipynb开始的，从文件名workfow可以看出，它隐含了一个基本的使用机器学习执行多因子预测的基本流（工作流）。

这个流程概括出来包括如下步骤：

设置股池，如all或csi300
加载行情
生成因子和标签
因子和标签预处理
设置时段（训练、验证、测试）
训练
预测

但是，这个流程只是最基本的研究流程。如果你觉得学习了这个流程就可进行实战，那就大错特错了。为啥这样说呢？先看看例子文件中的一个时段配置如下：

这里，最终模型绩效评估是要用测试集时段的数据来测试的。按此配置，是在训练和验证集上训练模型，然后用这个训练好的模型去预测测试集中每一天的收益率。这就有一个问题，测试集跨度4年时间，相当于在2020年你还在使用4年前模型来预测，这样的评价方式明显不符合实战流程。在实战中，是滚动训练和预测的，比如执行月度调仓，那么可能每月底都要重新训练和预测，这里滚动步长step就是一个月。因此，在进行模型绩效评价时，也要模拟实战这种滚动的过程，这样的评价结果才更加符合实际。

市面上讲股票机器学习多因子预测的文章，通常都是按照workflow_by_code.ipynb的流程模式讲，没有讲更加符合实际的滚

最低0.47元/天解锁文章

扫地僧量化

关注

11
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

扫地僧量化 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。