【编者注】从数据到结论,错误的路有千万条,而正确的路只有一条,引导人迈向正确结论的是数据直觉还是经验?这是一个无从回答的问题,在《超级数字天才》、《超爆魔鬼经济学》、《小趋势》等居多数据科普读物中有许多颠覆人们直觉认知的数据观点,比如喝酒后开车回家较步行回家要更安全,飞机较汽车要更安全、酷爱葡萄酒的法国人近年来饮用葡萄酒越来越少,导致法国葡萄酒商苦不堪言……如果脱离了场景看这些现象,你会觉得是无稽之谈,而现象的背后到底如何,太多的时候不是拥有数据就能解释的。
问:统计资料表明.大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全?
答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。 问:统计数字还表明,在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病? 答:正好相反。亚利桑那的气候对害肺病的人有好处,所以肺病患者纷纷前来,自然这就使这个州死于肺结核的平均数升高了。 问:有一个调查研究说脚大的孩子拼音比脚小的孩子好。这是否是说一个人脚的大小是他拼音能力的度量? 答:不是的。这个研究对象是一群年龄不等的孩子。它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年幼的男子拼得好些。
这三个片段着重说明了,在你听到一种统计关系时,切勿轻率地对其因果关系作结论。下面再举几个例子;
1)常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?不是,统计只不过反映了人们往往是在离家不远的地方开车,而很少在远处的公路上开车。
2)有一项研究表明其一个国家的人民,喝牛奶和死于癌症的比例都很高。这是否说明是牛奶引起癌症呢?不!这个国家老年人的比例也很高。由于癌症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。
3)一项研究表明在某个城市心力衰竭而死亡的人数和啤酒的消耗量都急剧升高。这是否表示喝啤酒会引起心脏病发作?不!两种情况的增加是人口迅速增加的结果。若按同样的理由,心脏病发作还可见归咎于上百个其他因素,如咖啡消耗量增加,嚼口香糖的人增多,玩桥牌更加盛行,更多的人看电视,等等。
4)一项研究显示出,欧洲某个城市的人口大量增加,同时鹳鸟窝也大量增加。这是否就支持了鹳鸟送来婴儿这一信念?(欧洲有一种说法,称婴儿是鹳鸟送来的,常用鹳鸟来临表示婴儿降生)。不!它反映的事实是这个城市内的房屋增多,鹳鸟就有更多地盘来筑窝了。
5)最近一项研究显示,大多数杰出的数学家是大儿子。这是否意味着头生子比以后生的儿子数学才能高些?不!这只是简单地反映出一个事实:大多数的儿子是头生子。
|