很多初学数理统计或者机器学习等一些涉及统计知识的学科的初学者,比如笔者(大一生),都会对样本方差
这一式子产生疑惑:为什么除以n-1而不是n呢?。几经求证,终于明白,故作此文向各位分享。本文涉及都是最基础的公式与概念,且内容十分详尽,篇幅不长。
进入正题:
无偏估计
通俗地讲,有些时候,总体X的某些参数未知,需要根据样本对参数进行估计。而无偏估计是参数的样本估计量的期望值等于参数的真实值。
通过证明可得,样本方差的期望值等于总体方差,换言之,除以n-1的这个版本才是总体方差的无偏估计(实属违背直觉,但直觉往往不靠谱)。
证明过程:
考虑到初学者,补充一下两个最基本的方差公式推导,在最后一步证明将多次用到。
首先得先看懂这个公式: