思想的多样性:均值回归的谬误

文 / 姚斌

在统计学范畴,很少会有比均值回归更有趣的概念。其原因有二:首先,人们几乎每天在生活中都会遇到几次;其次,几乎没有人理解它。因此,“均值回归” 成为人类做出错误判断的根源之一。这是统计学家加里・史密斯在他的《运气的秘密》一书中的研究主题。

■ 霍勒斯・西克里斯特的错误

均值回归最早由维多利亚女王时代的科学家弗兰西斯・高尔顿提出。高尔顿在遗传性状的研究中发现,最大的母本种子可能受到积极的环境影响,而最小的母本种子可能受到负面的环境影响,但环境影响并不会遗传给后代,因此,后代种子比母本更接近平均值。高尔顿把这种模式称为均值回归。但是,高尔顿没有意识到运气因素的影响。个子很高的父母可能运气非常好,但他们的子女通常不会有这样的好运气。

讽刺的是,统计学中最著名的回归错误是经济学家,甚至是诺贝尔奖获得者制造出来的。史密斯惊讶地发现,这些精通现代统计方法的评论者和作者居然没有意识到,他们创造了可怕的回归谬误。在回归谬误的引导下,人们更倾向于相信,操纵公司的是可预测的经济力量,而非运气。

回归错误的出现最初可以追溯到 20 世纪 30 年代。当时,经济学教授霍勒斯・西克里斯特花费了 10 年时间收集并分析了 73 个不同行业的数据。他汇编了 1920 年到 1930 年间的重要商业年度数据,包括零售业利润率、资产利润、零售业支出和资本支出。他根据 20 世纪 20 年代的具体数据,将一个行业的公司分为 4 个梯队:排名前 25%,排名 25%~50%,排名 50%~75%,以及最后的 25%。

对于在 1920 年排名前 25% 的那些公司,西克里斯特计算出了它们 1920 年到 1930 年每年的上述数据平均值。对于另外三个梯队的公司,他也进行同样的计算。几乎在每个案例中,1920 年排名前两个梯队的公司的计算结果都和 1930 年的平均值几乎相同;1920 年排名后两个梯队的公司的计算结果也都近似于 1930 年的平均值。

由此,西克里斯特发现了一个具有普遍性的现象,那就是成功和不成功的企业 “都会走向平庸”。这就是他的著作《商业中平庸者的胜利》的由来。平庸成为了新经济原则:竞争压力不可避免地让高级才能无处发挥作用。显而易见的出路就是保护那些更高级的公司,避免它们与那些不尽如意的公司竞争。杰出的统计学家哈罗德・霍特林一针见血地指出:“西克里斯特浪费了 10 年时间,最后什么都没有证明,他所谓的著名理论仅仅是均值回归效应的误导。”

在任何特定的年份中,无论是和其他公司相比,还就自身实力而言,最成功的公司往往更有可能是因为碰到了好运气而表现出色,而最不成功的公司恰恰相反。这就是为什么第一梯队、第二梯队公司的后续表现总是与普通公司的表现相近。同时,在极端情况下,当它们运气差而其他公司运气好时,它们的位置就会被取代。这些波动都是正常的,但并不意味着所有的公司终将走向平庸。正如平均成功率中的数据所揭示的那样,任意一个年份中最优秀的和最差的公司在下一年都会更接近平均值,但这并不意味着每家公司只能得到平庸的成绩。

■ 加里・史密斯的实证

为了说明商业中的自然波动,加里・史密斯也虚构了一个包含 100 家公司的行业,然后计算出利润中的资产回报率。和平均水平相比,一些公司获得了更高的利润,但每家公司的利润率比起平均利润率来说总是忽高忽低。史密斯随机生成的每一家公司在 1920 年的利润率,还用同样的方法得到了 1930 年的数据。按照西克里斯特的理论,史密斯根据 1920 年各家公司的利润率将它们分为 4 个梯队。分别显示了 1920 年各家公司的平均利润率以及 4 个梯队在 1930 年的平均利润率。在 1920 年处于第一梯队的公司当年的平均利润率为 48%,到了 1930 年这一数字则为 39%。这些公司的利润下降是因为它们在 1920 年的运气更好。实际上,1920 年的每个梯队公司的利润都更接近于 1930 年的平均值。

正如反常的父母通常会生出比他们正常的一些小孩,反之亦然。无论时间是前进还是倒退,利润总是会趋向一个平均值。史密斯采用同样的方法生成了 1910 年的各家公司的利润。在 1920 年位于前两个梯队的公司的利润不仅接近于 1930 年的平均值,同样也接近于 1910 年的平均值,后两个梯队的情况也是如此。1920 年各家公司利润在时间轴的前后方向都有朝平均值靠近的趋势。

史密斯假设每家公司在 1910 年、1920 年、1930 年这三个时间节点的盈利能力都是相同的,但实际情况是,公司的经营水平会随着时间推移不断提高。史密斯之所以这样假设,是为了展示,即便所有公司的盈利能力都保持不变,利润依然会趋同。1910 年和 1930 年的均值回归现象,反映出利润的数值总是上下波动的。但如果把公司分成不同的梯队,那么只能证明在 1920 年,它们要么运气极佳,要么运气极差。就像霍特林所说的那样,这些图表仅仅证明了利润率总是倾向于在某个数字附近徘徊。而花费 10 年的时间对这些数据进行研究则是浪费。

均值回归效应并不意味着每家公司在不久之后将会变得同样平庸,或者每个人都将处于同一水平。这种回归仅仅反映出,如果用有瑕疵的方法去衡量一个从前未被观察到的特质,那么往往会夸大该特质与平均水平的差距。

如果舍弃假设的数据,那么真实的数据是怎样的?史密斯计算了 1990 年到 2010 年之间的某个时间点上,道琼斯工业平均指数名册上的 28 家公司的利润率,同时获取这些公司在 1990 年、2000 年和 2010 年的利润。因为经济状况的起伏,这三个年份的平均利润率存在差异,分别为 6.6%、8.1% 以及 6.2%,因此他计算了每家公司的利润率与当年平均利润率的差值。根据 2000 年的数据,他把这些公司分成 4 个梯队,并计算出它们在三个年份的利润差。研究显示,所有公司的利润在 2000 年前后走向趋同。

■ 不能忽略运气的作用

在经济学现象中,我们可以经常观察到,随着时间的推移,商业利润往往愈发趋近平均值。经济学理论将这种现象视为竞争环境的一个典型特征。市场价格上升或成本下降这些突如其来的好运导致了超出正常水平的利润,进而催化了新的竞争。这种理论并不鲜见。许多观察者曾经撰文评论过这种均值回归的现象。但他们都忽略了运气的作用,而寄希望于给出一个经济学解释。最常见的解释是,竞争者们会对某些公司的发展感到眼红,继而迎头赶上,瓜分利润,而那些表现平平的公司会改变其一贯的做法并取得进步。

资本资产定价模型的创立者威廉・夏普在所著的一本投资教材中这样写道:“经济力量将最终导致不同公司的利润和增长率的趋同。” 为了证明这一结论,他研究了 1966 年利润增长率最高和最低的公司。十四年后也就是 1980 年,两种公司的利润率都接近于平均值。他因此自豪就得出这样的结论:“趋向平均值是一种显而易见的现象,并且无疑是真实的。” 就像 50 年前的西克里斯特一样,他并没有考虑到这种趋同可能仅仅是统计学上的回归现象而已。几年后,另外两位杰出的金融学教授犯下同样错误。尤金・法玛和肯尼斯・弗伦奇也描述了收入数据的回归现象。他们也将其原因归结于竞争。

在竞争环境中,这种利润率的均值回归现象在行业内外都很普遍。总是会出现一些新公司,模仿那些创造过超高利润的产品和技术。而利润较低的公司或许由于失败的预期或其他公司的接管,能够更好地利用现有资产。这些随意的解释可能有些道理,但无疑是以偏概全。这些证据毫无说服力,因为它们完全忽略了纯粹的统计学原因,即相对高收入的公司也可能只是因为运气更好。

总体而言,经营良好的公司比经营不善的公司更赚钱。但也不能忽略运气的作用。新资源和新技术的发现,带来比预期更成功的产品、竞争者偶尔引发的麻烦以及诉讼的输赢等等。在任意的特定年份中,总会有资产回报率高的公司同时拥有更好的运气,这也意味着它们这一年的资产回报可能高于前一年或者下一年。

■ 从优秀到卓越的随机性

忽视商业表现中的运气成分会带来不幸的后果。不管我们以什么标准衡量成功,每个公司总会出现大起大落。因此,业绩表现只是一种有瑕疵的衡量标准,并且极易受到均值回归效应的影响。如果一位研究者将表现极佳的公司汇编成一份名单,并且试图寻找它们之间的共性,认为是这些共性促成了它们的良好业绩,那么他就已经误入歧途了。无论是差公司、好公司,还是顶级公司,都不可避免地拥有一些共同特征。找到这些特征并无任何建设性意义,我们无法确定它们能否解释过去的成功,或者预测未来的辉煌。

许多管理类著作对所谓的 “好公司名单” 进行地毯式挖掘,然后宣称已经发现了这些公司的成功奥秘。2010 年,吉姆・柯林斯出版了他的《从优秀到卓越》。柯林斯说,他的著作给出了 “我们一直都在寻找的适用于任何组织的、永恒而普遍的答案”。他的结论是:“我们相信,几乎任何组织都可以实质性地提高它的地位和表现,甚至跨入顶级公司的行列,前提是它们能够有意识地将我们发现的理论付诸实践。”

柯林斯花了 5 年时间,研究了过去 40 年的股市行情走势,观察了 1,435 家公司,最后发现,有 11 只股票高于市场整体表现,并且在跻身顶级公司行业后仍然继续上升。这 11 家顶级公司具有 5 个共同特征。这些特征看上去非常有道理,但问题在于这是一个回顾性的研究,其可信度已经被数据挖掘这一模式削弱。柯林斯这样写道:“通过从数据中直接进行经验推理,我们创造出了这本书中的所有概念。我们的项目并不存在需要测试或证实的理论前提。我们选择基于手头的证据,从无到有地构建一个理论。” 柯林斯显然认为,这一声明让他的研究看上去颇为专业和中立。他并没有编造任何东西,只是根据数据得出了所有结论。

事实上,柯林斯承认,他并不清楚为什么一些公司比其他公司表现更好,同时对 “从数据中得出结论” 这一方法的弊端有充分的了解。当我们回顾那些所谓的好公司与差公司时,总能从中发现一些共性。因为柯林斯的发现看上去会非常有道理,所以数据挖掘的弊端并没有那么明显。但数据挖掘毕竟是数据挖掘,连柯林斯自己都承认,他的理论是在研究数据之后编造出来的。

柯林斯并没有提供任何证据证明他所描述的 5 个特征造就了这些公司的成功。如果要证明这些,他必须为这些特征提供理论上的正当性,并提前挑选那些拥有或者没有这些特征的公司,根据事先确立的一系列标准评价他们取得的成功。但这些工作他都没有做过。

《从优秀到卓越》出版之后,书中提到的 11 家公司有些走向了平庸,有些甚至一落千丈。2001 年,房利美 的股价还在 80 美元以上,2008 年已经跌到了 1 美元以下,2010 年甚至退市了。2009 年,电路城也破产了。这 11 家伟大的公司中,有 5 家在股市上的表现变得更加出色,其余 6 家则大不如前。这本书出版后不久,这 11 家公司的总体表现与市场水平相比,确实逊色了不少。

■ 回归效应的愚弄

无独有偶,汤姆・彼得斯和罗伯特・沃特曼的畅销书《追求卓越》也采取了非常相似的做法,带来了一模一样的问题。

彼得斯和沃特曼采用了 6 个指标用来衡量公司长期成功。其中的 3 个指标与增长率有关,另外 3 个用来衡量资本和资产回报。能够停留在榜单上的公司必须于 1961 年到 1980 年在其所属的行业中有 4~6 个指标排名前 50%。然后,他们让行业专家为这些公司 20 年来的创新纪录评分。最后,榜单中剩余的 43 家里,有 35 家是公开交易的公司,还有 8 家私有化公司或者其他公司的分支。由此,最终发现了它们 8 个共同特征。

史密斯认为,这本书充其量也只是研究者自身努力的记录。本质上,它也是一个回顾性研究,其可信度被数据挖掘严重削弱了。没有任何方法能够确认,一个行动派的公司是否会比其他公司更加成功,或者那些有着辉煌过去的公司在未来能否再创佳绩。

后来,一家金融机构的高管米歇尔・克莱曼重新审视这些公司,并对比了这本书出版的前后 5 年里,它们在长期成功指标方面的表现。她发现,该书出版后,每个类别下超过 2/3 的公司都开始走下坡路。它们并不是因为受到了《追求卓越》的诅咒,而是因为它们之前的出色表现有相当大的运气成分。

克莱曼也提到,这些公司如今的糟糕表现可能是因为统计学上的均值回归效应,但是她对回归效应的理解却是错误的。她认为,随着时间的推移,潜在的经济力量会使得新的竞争者进入颇具吸引力的市场,鼓励参与者离开低回报率的领域。因此,公司的业绩表现会逐渐回归到平均值。但事实上,均值回归效应是源于市场的随机浮动,并非经济力量。

在随后的实验中,克莱曼研究了该书出版后 12 年的数据,证实了她最初的结论。在该书出版后的 12 年里,这些公司的表现都有一定的提升。她的结论是,就整体而言,好公司变差了,而差公司却变好了。她提到了均值回归效应,却进行错误的解读:“有一种自然现象叫做均值回归效应,即随着时间的推移,团体中每一个成员的财产都会越来越接近于整体的平均值。这一概念广泛适用于经济力量将事物推向均衡状态的情形。”

史密斯指出,这种解释不仅忽视了运气的作用,而且在某种程度上非常接近西克里斯特的理论,即所有公司都在走向平均的均衡状态。而实际上,回归效应并没有假设 “经济力量将事物推向均衡状态”。经济力量可能存在,但均值回归效应是一种纯粹的统计学现象。当观察到的数据与未观察到的数据并不完全相符时,回归效应便会发生。例如,用盈利能力去衡量一家公司有多么伟大。

从长期来看,到 2013 年,彼得斯和沃特曼挑选的这 35 家公开交易顶尖公司里,有 5 家已经破产。整体而言,从这本书出版到 2012 年,书中的 15 家优秀企业的股票行情高于市场整体水平,另外 20 家则不尽如人意。

这些书本质上都是有缺陷的。此类问题在其他题材的书籍中也屡见不鲜,例如,“商业成功的秘密 / 秘诀 / 方法”“如何活到 100 岁” 等等,它们本质上都是基于对商业成功、长寿者生活方式的回顾性研究。如果我们相信行动派更容易成功,那么不妨找出那些行动派和非行动派公司,看看未来 10 年谁的表现更好。事实上,我们总是回顾过去,而非展望未来,这让我们很可能受到均值回归效应的愚弄。

今天的投资者如何看待均值回归?著名的投资者詹姆斯・安德森指出,均值回归失效的根本原因在于,技术革命会使得代表旧经济秩序的企业破产、消亡。就连霍华德・马克斯也说,将均值回归的思维模式应用于 “不褪色” 的商业模式将导致错误的结论。

参考阅读:

商业战略思想的局限

超越竞争优势的战略视角

从幸存者偏差到反事实推理

丹尼尔・卡尼曼和阿莫斯・特沃斯基:登顶思维的高峰

破除价值投资的迷思

价值或成长:没有无懈可击的策略

胜利者变,失败者不变


via:

  • 8
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值