我们有95%的信心认为总体均值落在置信区间内。
——莱曼(Layman)
其实,上述说法是有误导性的。置信区间源于频率统计,然而该说法却体现的是贝叶斯统计理论。本文将基于真实数据的模拟实验,探究置信区间的真正含义。
频率统计和贝叶斯统计的区别十分显著。在教科书中,以抛硬币为例来阐述这两个概念。
抛硬币一百万次,如果其中有50万次都是正面朝上,频率学派的统计学家就会断定抛硬币一方是公平的。但是,贝叶斯学派的学者则会在抛硬币前进行预判,判断此次抛硬币是否公平,然后依据证据逐步调整自己的观点。比如,如果一开始他认为该硬币正面朝上的概率是80%,但是,结束时,10次中,却有5次正面朝上,5次反面朝上,那么这就是公平的。
以置信区间而言,频率学派认为无论如何,总体均值是唯一且正确的,而贝叶斯学派则认为总体均值应先进行思维构建:先假设其值在一个可能区间内,然后给出其值有一定概率落在此区间内的程度(可信程度)并以此来证明猜想。那么到底哪个更有道理呢?通过以下例子来看看是