00 引言
上一篇文章我们介绍了什么是多因子模型,知道了多因子模型是定量刻画股票在每个因子上的暴露程度如何影响股票预期收益率的一个模型。
我们也弄清楚了在多因子模型中的两个核心概念:因子暴露(factor exposure)和因子收益率(factor return)。因子暴露,又称因子载荷,就是股票在因子(即描述股票某方面特征的因素)上的取值;因子收益率,则是指每单位因子暴露所承载的收益率。
随后,我们还大致介绍了MSCI(明晟)公司在其股权市场因子框架(Equity Factor Framework)中提出的10大类影响和决定股票收益率的因子,每个大类之下又细分出二级因子和三级因子。
那么,如何构建出一个多因子模型呢?
本篇我们将对多因子模型的构建步骤进行一个梳理。
01 多因子模型的构建步骤
关于多因子模型的构建,虽然不同的投资者会有不同的方法和模式,但大致的步骤都是相似的。
经过总结和梳理后,我们将多因子模型的构建步骤归纳为五个部分,包括:因子选择、数据预处理、因子检验、大类因子合成、模型构造及检验。
本篇文章的后续章节将对这五个步骤进行一个不知道算简要还是详细的介绍。
02 因子选择
作为构建多因子模型的第一步,我们需要通过阅读文献和总结经验等方式选择各种因子,建立一个原始因子库,并综合经济含义、金融逻辑以及相关参数等来确定因子的计算方法。
MSCI的股权市场因子框架(Equity Factor Framework)中列出的10大类因子(包括:波动性因子Volatility、质量因子Quality、动量因子Momentum、价值因子Value、市场情绪因子Sentiment、股利因子Yield、规模因子Size、成长因子Growth、流动性因子Liquidity、宏观因子Macro,每个大类之下又细分出二级和三级因子),可以说基本涵盖了所有常用的因子,具体如下。
我们在该因子框架的基础上,结合MSCI于2018年8月发布的最新Barra中国股权市场模型(The Barra China