分类模型
预测的实证研究结果与这种推论一致。虽然增加模型可以提高准确性(根据多样性预测定理,必定会是这样),但是在已经拥有了一定数量的模型之后再继续增加模型,每个模型的边际贡献就会下降。例如,谷歌公司在实践中发现,仅用一位面试官评估求职者(而不是随机挑选),会使录用一名高于平均水平雇员的概率从50%提高到74%,加入第二位面试官可以把这个概率提高到81%,再加入第三位面试官则只能把这个概率进一步提高到84%,加入第四位面试官也只能提高到86%……使用20位面试官也只能将这个概率提高到90%多一点。这些证据表明,增加面试官人数的作用是有限的。
宫:这回答了我昨天的疑问,模型并不是越多越好,拥有了一定数量的模型之后再增加模型,每个模型的边际贡献就会下降。
如果能构建出多个多样性的、准确的模型,我们就可以做出准确的预测和估值,并选择正确的行动。这些定理验证了多模型思维逻辑的可靠性。但是,构建出满足这些假设的许多模型,却不是这些定理所能做到的,也不是它们所应该做到的。在实践中,我们可能会发现我们可以构建出3个或5个很不错的模型。如果是这样,那就太好了。我们刚刚讲过,加入1个模型后可以改进8%,加入3个模型后改进幅度可以达到15%。请不要忘记,第二个和第三个模型不一定比第一个模型更好,它们也许会更糟。但是,即使它们的准确性稍差,但只要分类(字面意义)有所不同,就应该把它们加入进来。
宫:我所理解的是只要这些模型的侧重点不一样,那把他们加进来,也会增加模型整体的准确性。
适当的模型粒度
创造过多的类别会导致对数据的过度拟合,而过度拟合会破坏对未来事件的预测。
一对多
学习模型需要时间精力以及广泛的兴趣和知识。为了减少学习成本,我们可以采用一对多方法。我们提倡掌握适量的、比较灵活的模型,并学会创造性地应用它们。例如,我们可以使用流行病学模型来解释玉米良种的扩散、Facebook的风行、犯罪行为的传播和流行明星的“吸粉”。我们将信号传递模型应用于对广告、婚姻、孔雀羽毛和保险费的分析。我们利用进化适应的崎岖景观模型解释为什么人类不需要鲸鱼那样的喷气孔。当然,我们不能随便拿起一个模型就将它应用到任何情境之中。但是,大多数模型都是灵活的。而且,即使失败了我们也会有所获益,因为尝试创造性地使用模型能够暴露它们的局限,这是一件很有趣的事情。
一对多方法是一个相对较新的方法。过去,特定的模型只属于特定的学科。经济学家有供求模型、垄断竞争模型和经济增长模型;政治学家有选举竞争模型;生态学家有关于物种形成和复制的模型;物理学家有描述运动规律的模型,等等。所有这些模型都是针对特定目的而构建的。那个时候,科学家们不会将物理模型应用到经济学领域,也不会用经济学模型去研究大脑,就像普通人不会用缝纫机来修理泄漏的水管一样。