通常情况下,总体是不可得到的。我们只能通过样本参数来推断总体参数。比如,通过样本的均值推断总体的真实均值,那么,均值的置信区间(Confidence Interval, CI)告诉我们对总体真实均值估计的精确度。
如果样本量小且变异较大,那么样本均值可能与总体真实均值差别很大;如果样本量大且变异较小,那么样本均值可能与总体真实均值非常接近。也就是说,对总体真实均值估计的准确性是由样本量大小以及样本数据的变异程度决定的。因此,统计分析同时考虑样本量大小和变异性生成总体均值的置信区间,以判断对总体真实均值估计的精确度。正如它的名字一样,置信区间是一个范围。
举个简单的例子,我们想知道全校女生的平均身高是多少,我们不可能把全校所有女生的身高都测量一遍,只能把自己班上的女生身高测量一遍,通过自己班上女生的平均身高(样本的平均值)来推断全校女生的平均身高(总体的真实均值)。通过测量自己班上女生的身高,并计算出置信区间(假如计算95%置信区间),那么我们就可以说,我有95%的把握敢说全校女生的平均身高在多少到多少之间。
要解释均值的置信区间,我们的前提假设是总体要服从正态分布,且样本是随机抽样的。那么95%置信区间的含义可以理解为:进行100次抽样,可计算得到100个置信区间,95个置信区间包含了总体的真实均值,5个置信区间未包含总体真实均值。实际工作中,我们仅得到一个样本数据