from:https://guorn.com/forum/post/p.76943.78949722606344?tag=share
一、因子那么多,怎么用才有效?(剔除多重共线性)
1、因子分类:将因子按照风格或经济学含义不同分为收入因子、规模因子、技术因子、估值因子、统计因子等大类;
2、相关系数法:计算所有因子的相关系数在高度相关的因子中挑选代表因子留下,保证剩余因子相关性不高,避免多重共线性;
3、主成分分析法:采用主成分分析法,计算能够代表各大类因子的第一、第二、第三主成分,只取主成分因子避免多重共线性;
4、多因子合成:利用QEPM中的最大化因子IC_IR的优化方法,把同类因子合成为一个大类因子,因子数据必须经过处理(winsorize去极值、neutralize中性化,消除行业和风格因子等的影响、standardize标准化、orthogonalize残差正交化调整,因子间存在较强相关同质性时,使用施密特正交化方法对因子做正交化处理,用得到的正交化残差作为因子去除共线性)
二、因子那么多,几个因子组合才是最好?(我们来搭积木)
国信证券的金融工程研究报告中,选择了23个因子,通过穷举的方法组合构建了23个单因子模型、253个双因子模型、347个三因子模型、520个四因子模型以及300个五因子模型,通过分析他们的历史表现,得出因子边际效用递减的结论。
1、单因子模型回测:
2、双因子模型回测:
3、三因子模型回测:
4、各因子模型横向比较:
强烈要求:果仁提供快速搭积木的工具包,单因子、双因子、三因子的快速组合回测
三、因子轮动,如何挑选最佳适配期因子
1、如何区分因子属于长期因子还是短期因子:用高频的因子预测低频因子
- 长期因子:随价格缓慢变动,所以变化更慢,平缓,理论上应该更低频率(长波低频)
-
短期因子:随价格迅速变动,所以变化更快,陡峭,理论上应该更高频率(短波高频)
2、如何区分长短波
- 方差法
- 均值交叉点,曲线按照均值平移,均值为0轴,交点多少可以反映出频率大概情况。实际是因子做diff然后计算反转个数替代。
- 相关系数
3、方差法
- 因子先做差分diff
- 差分后因子在一定时间内的 “相对均值标准差=标准差/均值” 作为频率的衡量
- 如果频率高于价格closeprice对应的频率,就认为比基准更高频,可以使用
- 如果低于closeprice频率,认为因子属于长期因子,不适用短期预测
4、交叉点法
- 对因子做差分diff(后面的因子都是指差分后的)
- 差分后因子相邻的两天,如果有正负变化,认为有一次交叉
- 统计周期内closeprce的正负变化次数为基准,差分后因子次数,如果因子高于closeprice基准则认为高频,可以采用。否则不用
5、最佳适配期因子列表(采用方差法)
给出策略轮动周期(5天、20天等),输出适合此周期的因子列表(其实是比此周期高频因子)
三、因子轮动,测算近期最强的因子
1、把各因子按照最高最低1/10排列,每5天进行一次调仓,来测算近一段时期的有效因子情况,
2、按周、半月、一月、一季度、近半年、近一年分别排序。
强烈要求:果仁提供近期因子表现的清单