培根曾经说过:“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。”我想对数据资料的判断和接收也是如此。虽然经验告诉我们“眼见为实”,但眼睛告诉我们的也许隐瞒了或者夸大了一部分事实。
启发:我们需要从数据挖掘出背后的真实原因,单纯的数据呈现,就有可能出现得到有偏差的结论,甚至导致制定错误的计划。
总结:
本书是一本如何利用统计以达到瞒天过海目的的入门读物。看上去,它很像骗子的行骗指南。就像一个已退休的窃贼在神不知、鬼不觉地撬锁的过程中,他的回忆录达到了研究生课程水平。但是毕竟,骗子早就掌握了行骗的技巧,而诚实的人出于自卫也应该学会它。
研究方面的收获
1.抽样存在内偏
耶鲁大学毕业生收入:参与调查的人本身就不能代表全部毕业生。它也仅仅代表了 1924 级耶鲁学生中可以联系到的,并愿意站出来说出所赚数目的这个特殊群体。
当数据经过层层统计处理,最后简化成一个小数形式的平均数时,结论似乎被确定的光环所笼罩,但只要再仔细留心整个抽样过程,这个光环就会破灭。
随机样本的检验标准是:总体中的每个名字或事物是否具有相同的几率被选进样本?
2.精心挑选的“平均数”
众数、平均数、中位数
买房的故事:
开发商:附近居民的年收入大约有 15000美元。
纳税者委员会的成员:附