广告:本人的单因子测试视频教程https://edu.csdn.net/course/detail/25572
在前面一节,我们成功计算出来了因子值。
在开始今天的内容前,我们要先了解几个概念。许多书本上,可能不会这样讲,这个仅仅是笔者的一些感悟。
0.几种factor
先来弄清楚笔者自己总结的factor的生命周期
1)raw facto
raw factor就是上一次我们计算出来的factor,没有什么可以更多的解释的。
2)Winsorized-raw factor
我们知道,金融数据充满了噪音,也就是意味着,有很多异常值,所以我们要对这些股票的存货周转率值做一个处理。比如说,对于异常值,我们可以用Winsorized或者直接剔除的方法。Winsorized方法比较常用,但是也不一定有效。Winsorized方法说白了,就是让所有的raw factor有一个上下限,大于这个上限的,就等于上限的值,小于下限的,就等于下限值。通常,上下限可以用分位数或者标准差来体现。
3)raw z-score
这一步其实就是factor的标准化,也就是,减去均值,然后除以标准差。相对而言好理解。把因子值都做标准化后,是为了以后很多因子可以相互combine。如果不做标准化,量纲就不一样,组合在一起就不会有什么意义。
4)neut-score
我们做完标准化后,需要对因子值做中性化处