什么是误差范围
曾经,科学家们不承认实验可以有误差,认为所有的测量都必须是100%准确的,把任何误差都归于错误。后来人们才慢慢意识到误差永远存在,而且不可避免,即使设计再完美的实验也无法完全避免随机事件的干扰,所以做科学实验往往要测量多次,用多次结果的平均值或其他统计手段得到的计算结果,再加上一个误差范围作为最终的结果。
什么意思呢,比如马云智商是100,但其中有正负5的统计误差,所以马云的智商范围就是[100-5,100+5]这么一个范围。真实的智商值当然只有一个,但是这个数是多少,我们不知道,它可以是这个误差范围内的任何一个数字。这个区间就是置信区间,也就是误差范围。
什么是置信区间
很多时候,我们无法得到整体的情况,只能有样本的统计结果来预估整体的结果。但是样本总归不是整体,不同样本得到的结果还不同,所以样本结果和整体结果之间的误差区间,就是置信区间,
例如,我要统计中国18岁及以上年龄男性的身高均值。我们不可能去搜集全中国所有符合条件的人的身高,但是这个总体的平均值肯定存在。为了得到这个总体的信息,我们通过抽样的方法得到样本信息,然后来估计总体信息。
图中每一个横短线代表一个样本的置信区间,除了一个红色的那条线,其他黑色的线都包含了总体平均值。如果我们抽了100个样本,得到100个这样的区间,其中有95个区间包含了总体样本平均值,那我们就可以说这个包含所有样本区间的某个大区间内的置信水平为95%。
换句话说,置信水平就是指区间包含总体平均值的概率p(a<样本平均值<b)=Y%