姚耀军
学习过统计学基础的朋友们都知道:总体方差
,其中
为总体均值,N为总体容量;样本方差
,其中
为样本均值,n为样本容量。令很多初学者纳闷的是,为什么样本方差公式的分母为n-1而不为n呢?
为了回答上述问题,我们首先来理解一个事实:一般而言,总体分布要比样本分布显得更离散。例如,当全国成年人的身高数据构成一个总体时,总体分布的离散程度就会因“巨人”姚明的身高而变得比较大。然而,若从总体中随机抽取1000人形成一个样本,则可以预期,样本分布的离散程度要比总体分布的离散程度小,其基本的道理是:样本包含姚明的概率极低。换言之,1000个样本观测单元大概率都是一些具有正常身高的人。
总体分布比样本分布显得更离散