在重新学习统计学的过程中,我发现了一个被我忽视多年的问题,那就是总体方差是除以n,按理来说样本方差的分母也应该是除以n才对,而事实上,其分母却是除以n-1;我觉得这个问题还是值得研究一番的,在百度上搜索了很多的解释,有很多答案都很有亮点,但都不太完整,所以我想整理一份最通俗易懂最完整的解释,希望对后来人有所帮助。
1.明确n-1是为了实现无偏估计
那为什么n-1就是无偏估计,而除以n就是有偏估计了呢?
接下来给出数学的证明:
首先,我们假定随机变量
的数学期望
是已知的,然而方差
未知。在这个条件下,根据方差的定义我们有
由此可得
.
因此是方差的一个无偏估计,注意式中的分母不偏不倚正好是!
这个结果符合直觉,并且在数学上也是显而易见的。 现在,我们考虑随机变量 的数学期望
由此可得
.
因此是方差的一个无偏估计,注意式中的分母不偏不倚正好是!
这个结果符合直觉,并且在数学上也是显而易见的。 现在,我们考虑随机变量 的数学期望