原标题:手把手教你构建量化因子分析体系
挖掘Alpha因子、评价Alpha因子、改进Alpha因子是量化投资者职业生涯永恒的奋斗目标,而一套严密有效的因子分析体系是这一切的基石。“不以规矩,不能成方圆”,没有系统的因子分析体系,Alpha研究举步维艰,难以筑起量化研究的高楼。
萝卜投资结合国内外量化研究经验,从量化投资者实际需求出发,构建了一套包含因子统计分析、IC分析、分组测试等模块的完整因子分析体系,是投资者进行Alpha研究的利器。下面我们按照投资流程来看看如何构建因子分析体系。
Alpha因子的预处理
不论是基本面因子、技术面因子,亦或是一致预期或者舆情因子,都是基于某种逻辑计算出来的数据结果,可能存在不适合进行因子分析的数据特征,同时我们希望因子的分析结果可以横向比较,因此我们在对Alpha因子进行评价分析前需要进行标准化的“预处理”,主要步骤包括:
◆去极值:顾名思义,是对因子中异常值的处理,例如PE因子可能会由于分母的earning过小导致其PE出现极端大值,这些异常值会干扰后续因子中性化(回归)以及IC分析的结果,因此我们需要进行去极值,萝卜投资的winsorize模块提供了如下几种去极值方法:
a)3σ法则:正态分布去机制,将截面上处于均值±3σ之外的因子值拉回;
b)分位数法:根据p-value将截面上因子值最大与最小的p-value/2按比例拉回;
c)中位数法:
将中位数±5MAD的因子值拉回。
上图是以某期PE为例的去极值效果,在不改变因子结构的基础上对异常值进行了拉回,方便后续因子分析研究。
◆缺失值填充:另一类常见的问题是缺失值,一般而言,我们希望因子的空缺值越少越好,我们用因子覆盖率来衡量空缺值的数量: