基于alphalens对qlib的alpha158做单因子分析

本次百天计划第32篇“AI+量化投资”系列。

这个本次100天小目标,要基于qlib打造一个AI量化投研平台基础

今天的重点是“因子分析”。

因子就是机器学习里的特征。

有人说,回测不重要,因子分析更有意义

回测只能证伪,而不能证实。

什么意思,就是回测结果不行,那实盘肯定不行,因为过往历史数据告诉你,你这个策略结果不好;但回测结果很好,实盘不一定行,为什么呢?

这里本质大家要想清楚,即便你的策略的确不包含“未来函数”,没有错误,但很有可能包括了”隐性“未来函数,比如2016年以来,价值因子明显有收益,像消费行业起飞,若你的策略使用的是价值因子,那超额收益一定不错,但这个一定可以持久的嘛?未必。

因子分析简单说就是看因子与结果之间在统计意义上的相关性,尽管是线性的相关性,但至少有统计学意义的数学基础保证,当然更进一步,我们可以对因子进行非线性的归因分析。

tips1:加载alpha158需要的时间比较长,使用jupyter notebook来测试会大幅度提升效率,尤其是需要频繁试验自己的想法。

tip2: xgboost相比lightGBM,无论是CPU还是内存,还是训练时间,都大得多。机器学习量化相对传统量化,对于机器的要求高很多。

01 因子分析神器 alphalens

alphalens是量化平台鼻祖quantopian的三大开源包之一。

使用pip直接安装即可。

pip install alphalens

def get_clean_factor_and_forward_returns(factor,
                                         prices,
                                         groupby=None,
                                         binning_by_group=False,
                                         quantiles=5,
                                         bins=None,
                                         periods=(1, 5, 10),
                                         filter_zscore=20,
                                         groupby_labels=None,
                                         max_loss=0.35,
                                         zero_aware=False,
                                         cumulative_returns=True)

重点关注两个参数,一个是因子factor,二是价格prices。

alphalens使用简单,难在于数据格式整理,

factor的格式与qlib的比较像,它叫asset,qlib叫instrument。

价格就是每支股票,每天的收盘价:

从alpha158里直接读出来一个因子:KMID

通过修改index.names:

从qlib数据库里读出的数据格式如下:

使用pandas的处理功能,把它变成alphalens的格式:

而后调用就非常简单了:

因子的收益分析:

累计收益分析:

还有好多图就不全贴出来了。

明天结合qlib以及alphalens的代码一并来解读。

小结:

1、当下的模型其实都差不多,核心还是特征工程。

2、对于量化而言,数据预处理都差不多,一则就找更好的数据源,二则找更好的特征。

3、就特征挖掘而言,有两种,一是通过经验,实证,有逻辑的去构建因子,还有一种就是纯粹大数据挖掘。后者更像黑盒,但更符合机器学习的玩法。worldquant的alpha101,一看公式很难想象那是人工设计出来的,应该有机器参与的部分。

4、qlib肯定有不完善的地方,但目前来看,还是值得坚守,自己造一个平台,一开始看似爽,但后面到了大数据,算法阶段,该踩的坑一个不少,都得踩,毕竟微软还是有它的实力在,没有必要从头造轮子。

5、我们今天引入的alphalens就是因子分析很好的补充。

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI量化投资实验室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值