一、为什么需要置信区间?
误差永远存在,而且不可避免。即使实验条件再精确也无法完全避免随机干扰的影响,所以做科学实验往往要测量多次,用取平均值之类的统计手段去得出结果。
多次测量,是一个排除偶然因素的好办法。如国足输掉比赛之后经常抱怨偶然因素,有时候是因为裁判不公,有时候是因为主力不在,有时候是因为不适应客场气候,关键是如果你经常输球,我们还是可以得出你是个弱队的结论。而国际足联的世界排名,是根据各国球队多次比赛的成绩采用加权平均的办法统计出来的,这个排名比一两次比赛的胜负,甚至世界杯赛的名次更能说明球队的实力。但即便如此,我们也不能说国际足联的排名就是各个球队的“真实实力”。这是因为各队毕竟只进行了有限次数的比赛,再好的统计手段,也不可能把所有的偶然因素全部排出。
所以,在科学实验中总是会在测量结果上加一个误差范围。比如经过测量马云的智商是100,测量误差是±5。这句话的意思是说,马云智商是100,但其中有正负5的统计误差,所以马云的智商范围就是[100-5,100+5]这么一个范围。
真实的智商值当然只有一个,但是这个数是多少,我们不知道,它可以是这个误差范围内的任何一个数字。
考试成绩也如此,假设一个同学考了两次才过英语四级,第一次53分,第二次63分。他说这是略有进步,我说你这不叫进步,叫都在测量误差范围之内。
这里的误差范围(区间)在统计概率中就叫做置信区间。简单来说,置信区间就是误差范围。