不同方差的含义
s=Σ(x−x¯)2n−−−−−−√
含义:表示总体数据集的方差。
s=Σ(x−x¯)2n−1−−−−−−√
含义:表示样本的方差。
为什么要这样做呢?
原因在于:比如在高斯分布中,我们抽取一部分的样本,用样本的方差表示 满足高斯分布的大样本数据集的方差。由于样本主要是落在x=u中心值附近,那么样本的如果用
s=Σ(x−x¯)2n−−−−−−√
算方差,那么预测方差一定小于大数据集的方差(因为高斯分布的边沿抽取的数据很少)。为了能弥补这方面的缺陷,那么我们把公式的n改为n-1,以此来提高方差的数值。这种方法叫做贝塞尔校正系数。
具体请看视频