总体方差,也叫做有偏估计,其实就是我们从初高中就学到的那个标准定义的方差:
,其中, 为总体的均值, 为总体的标准差, 为总体的样本数。
样本方差,无偏方差,在实际情况中,总体均值是很难得到的,往往通过抽样来计算,于是有样本方差,计算公式如下:
或者,其中, 为样本的均值, 为样本的标准差, 为样本的个数。
实际操作中,我们一般通过抽样来验证总体。就会面临以下两种情况:
(总体的均值)已知
即无偏估计,方差
(总体的均值)未知
即有偏估计,此时,如果直接使用作为估计,那么你会倾向于低估方差!
这是因为
换言之,除非正好,否则我们一定有,而不等式右边的那位才是的对方差的“正确”估计!
那么,在不知道随机变量真实数学期望的前提下,如何“正确”的估计方差呢?答案是把上式中的分母换成,通过这种方法把原来的偏小的估计“放大”一点点,我们就能获得对方差的正确估计了:
那么,至于为什么分母是而不是或者别的什么数呢?
即证明