PHP多因子方案,多因子策略之冗余因子

引言:

上一篇文章,我们讲到有效因子的检验。在选择了有效因子之后,我们还需要进行一步去除冗余因子。

不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除, 而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

主要步骤:

我参考了网络上不同的剔除方法,但都仅仅浅尝辄止,没有进行深入的代码探究。我们先说剔除冗余因子的主要步骤:

假设现有k个因子,回测周期可分为m个月,股票可均分为n个组合,

1、分别按不同因子的大小进行排序,讲股票分为n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高。分值赋给每月该组合内的所有个股。

如果组合10的收益大于组合1,那么就将组合 i 各个股票的各个股票分值设置为 i ,各个组合的分值从低到高进行排列分别是

1,2,3,4,5,6,7,8,9,10。如果组合1的收益大于组合10,那么正好是反过来 10,9,8,7,6,5,4,3,2,1。

2、按月计算个股的不同因子得分间的相关性矩阵。

3、在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值。

4、设定一个得分相关性阀值,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

测试参数:

我们根据步骤,在掘金平台上实现

测试参数声明:

测试平台:掘金量化

测试时间:2016-01-01——2018-01-01

测试股票池:“上证50”成分股

测试因子:

f41e39f6458bef3d91fd8f788997ade3.png

测试步骤:

1、获取每个月的首个交易日,月初获取每只股票的因子数据及当月收益率,根据因子数值排序,将股票分为10组,根据平均收益为股票组合打分,分值赋予对应组合中所有股票。

2、分别测试股票关于四种因子的分值,根据每月结果,计算相关性系数矩阵。

3、计算整个测试周期的相关性系数平均值。

4、设定阈值,剔除冗余因子。

结果:

我们看几个月份的相关性系数矩阵

65d9219ba456fc14ec89e6cb12eec70d.png

2016年3月23cc027ff9159ffbb5935c9c9c9ba8c6.png

2016年4月

05d2ad9815cb7fd5ef2ff9921dba272e.png

2016年6月

561737fd9c7b9171e4f2e1ad0c465fd1.png

2016年10月

cc66f941bc9ba0fb1a54226f36db40d2.png

2016年12月

7319b97f7c5340730313f7715087bf25.png

2017年6月

再来看各个月的统计表格

9bc848762d5666824383c9685f8ac044.png

我们经过统计,得出平均相关性系数矩阵

b0cd3089682207020e990f0454b6aa14.png

结论:

我们选取的四个有效因子,平均相关性系数均小于0.25,也就是我们选取的因子相关性很低,我们可以放心的进行因子间的组合,构建新的因子。

冗余因子剔除的思想:计算股票根据每个因子的所获得的分值,通过比较该分值,从而得到因子间的相关性,相关性高的,剔除其中一个,留下有效性高并与其他因子相关性低的因子。

查看冗余因子策略源码:https://www.myquant.cn/community/topic/695

来源:掘金量化myquant.cn   文/经纬量化 宋瑞笛   转载请注明出处!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值