多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则被卖出。
举一个简单的例子:有一批人参加马拉松,如果想要知道哪些人会跑到平均成绩之上,那么只需要在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些与企业的收益率最相关的因子即可。
各种多因子模型的核心区别:第一在于因子的选取,第二在于如何用多因子综合得到一个最终的判断。
一般而言,多因子选股模型有两种判断方法:一是打分法;二是回归法。
打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,再把最新的因子值代入回归方程,得到一个对未来股票收益的预判,然后以此为依据进行选股。
多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立、模型的评价和持续改进5个步骤。
1.候选因子的选取
候选因子的选取主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。
例如,在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年年底,该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在