作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。 已获授权转载
摘要:Green, Hand and Zhang (2017) 通过 Fama-MacBeth 回归同时检验了 94 个因子,发现其中 12 个是显著的。他们的研究方法对于 A 股的因子投资实践有很大的价值。
1.引言
在发表偏差(publication bias)的驱使下,多重检验(multiple testing)已经成为学术界在进行 asset pricing 时的普遍做法。然而,很多发表于顶级期刊的所谓能够解释股票截面预期收益差异的因子都是虚假发现(见《出色不如走运(II)?》)。针对这个问题,2011 年,前美国金融协会主席 John Cochrane 教授在主席演讲中向学术界提出挑战 —— 到底哪些因子能独立解释股票预期收益截面差异?
2017 年,一篇发表于顶刊 Review of Financial Studies 上的文章通过使用 Fama-MacBeth Regression (Fama and MacBeth 1973)同时检验 94 个学术界发表的异象回答了这个问题(Green, Hand and Zhang 2017,下文记为 GHZ)。
事实上,这并不是学术界就此问题的唯一尝试。比如,Harvey and Liu (2018) 提出了一个基于回归的框架来排除运气的成分以便检验真正有效的因子。不过 Harvey and Liu (2018) 这篇文章的核心内容是介绍他们提出的方法而非实证结果。而 GHZ 的研究指出了美股上真正有效的因子,具有更高的实证价值。无论是这些因子还是 GHZ 使用的方法对 A 股都有不小的借鉴意义。
本文就来介绍 GHZ 这篇论文。
2.数据和因子
在研究中,GHZ 利用了 CRSP,Compustat 以及 I/B/E/S 数据库的数据首先挑选出了 102 个因子,回测时间是 1980 年 1 月到 2014 年 12 月,频率为月频。回测期之所以从 1980 年开始是由上市公司基本面数据的可得性决定的;同时包含 NYSE、AMEX 以及 NASDAQ 的上市公司。
除此之外,GHZ 的特别之处是考虑了微小市值公司对评价因子有效性时的影响。为此,他们将所有股票根据市值分成三挡:
1. 市值超过中位数的股票为大市值组;
2. 市值在中位数和 20% 分位数之间的为小市值组;
3. 市值在 20% 分位数之下的为微小市值(microcap)组。
微小市值的这些股票的市值之和仅占所有股票总市值的 3%。为了避免回归分析时对它们过度加权,GHZ 采取了两种回归方法:
1. 对所有股票采用市值加权最小二乘法(VWLS);
2. 对前两组的股票(即所有股票中排除微小市值组)采取普通最小二乘法(OLS)。
作者认为上述两种方法能够更合理的找到有效因子,并通过合并这两种回归的结果确定最终的显著因子。作为比较 —— 同时也是为了说明过度加权微小市值股票的危害 —— GHZ 也同样对所有的股票进行了 OLS 回归。不出意外,由于微小市值股票存在造成的偏误,这种方法能够发现更多的“有效”因子,但很多因子在非微小市值股票上并不显著。
在进行多因子同时回归时,因子间的共线性是必须考虑的问题。共线性会造成因子收益率标准误(standard error)的巨大误差,从而无法有效的评价因子是否显著(见《为什么要进行因子正交化处理?》)。GHZ 使用 variance inflation factors(VIF)对因子进行了初步筛选,并剔除了 8 个 VIF 高于 7 的因子