彻底理解样本方差为何除以n-1

原创 2017年09月06日 00:10:35

    设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式:


    很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。

无偏估计

    以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为。如果你只是把作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:然后在把这些平均值,再做平均,记为:,这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值,如果满足,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,就是的一个取值无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

    介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:


那么,我们根据无偏估计的定义可得:



    由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:


到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。

    如果让我们假设的样本方差乘以,即修正成如下形式,是不是可以得到样本方差是总体方差的无偏估计呢?


则:



    因此修正之后的样本方差的期望是总体方差的一个无偏估计,这就是为什么分母为何要除以n-1。


版权声明:本文为博主原创文章,转载需注明出处。

为什么样本方差里面要除以(n-1)而不是n?

前段日子重新整理了一下“为什么样本方差里面要除以(n-1)而不是n?”这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的                   ...
  • fuming2021118535
  • fuming2021118535
  • 2016年05月01日 14:18
  • 27719

为什么样本方差公式中要除以n-1而不是n

在学习概率与数理统计时,我们接触到的比
  • iverain
  • iverain
  • 2014年08月24日 17:10
  • 4634

样本方差的无偏估计与(n-1)的由来

原文出处: http://blog.sina.com.cn/s/blog_c96053d60101n24f.html 在PCA算法中用到了方差,协方差矩阵,其中方差公式为,协方差矩阵公式为,当时不明白...
  • maoersong
  • maoersong
  • 2014年03月22日 20:06
  • 12240

样本方差为何除以n-1?

方差的概念从小学就开始建立了。对于一个随机变量,分别表示其数学期望和方差,从中随机抽取n个样本,是样本均值,是样本方差。那么为什么样本方差是除以而不是n呢?   这里涉及到一个无偏估计的概念,是...
  • gongxifacai888
  • gongxifacai888
  • 2015年07月11日 08:58
  • 199

关于样本方差分母为什么是n-1理解

样本方差计算公式里分母为n-1的目的是为了让方差的估计是无偏的。无偏估计(unbiased estimator)比有偏估计(biased estimator)是更符合数学推导的。在这里最让我们困惑的地...
  • Li_tian_yang
  • Li_tian_yang
  • 2018年01月03日 19:45
  • 96

为什么样本方差公式中要除以n-1而不是n

在学习概率与数理统计时,我们接触到的比
  • iverain
  • iverain
  • 2014年08月24日 17:10
  • 4634

为什么样本方差(sample variance)的分母是 n-1?

来源:http://www.zhihu.com/question/20099757 我来补充一个新的视角吧,希望能帮助理解。 有很多人提到了“自由度”的概念。那么自由度是什么?说的好玄乎,什么...
  • ljj583905183
  • ljj583905183
  • 2014年11月08日 21:14
  • 736

样本方差的无偏估计与(n-1)的由来

假设X为独立同分布的一组随机变量,总体为M,随机抽取N个随机变量构成一个样本,和是总体的均值和方差, 是常数。是对样本的均值和方差,由于样本是随机抽取的,也是随机的。 既然是随机变量,就可以观察...
  • yangzhenzhen
  • yangzhenzhen
  • 2017年06月14日 16:17
  • 496

样本方差的无偏估计与(n-1)的由来

假设X为独立同分布的一组随机变量,总体为M,随机抽取N个随机变量构成一个样本,和是总体的均值和方差, 是常数。是对样本的均值和方差,由于样本是随机抽取的,也是随机的。 既然是随机变量,就可以观察他们...
  • AnneQiQi
  • AnneQiQi
  • 2017年03月06日 19:26
  • 404

求方差时除以n和n-1的区别

我们通常所说的方差有两种,一种是样本方差,一种是总体方差。当求样本方差的时候,分母是n-1;当求总体方差的时候,分母是n。在数理统计中,一般所求的都是样本方差,这就需要构造一个统计量样本方差S^2(注...
  • Love_CppAndC
  • Love_CppAndC
  • 2012年01月06日 17:27
  • 9692
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:彻底理解样本方差为何除以n-1
举报原因:
原因补充:

(最多只允许输入30个字)