彻底理解样本方差为何除以n-1

14人阅读 评论(0) 收藏 举报
分类:

转载出处:https://blog.csdn.net/hearthougan/article/details/77859173


设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式:


    很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。

无偏估计

    以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为。如果你只是把作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:然后在把这些平均值,再做平均,记为:,这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值,如果满足,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,就是的一个取值无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

    介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:


那么,我们根据无偏估计的定义可得:



    由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:


到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。

    如果让我们假设的样本方差乘以,即修正成如下形式,是不是可以得到样本方差是总体方差的无偏估计呢?


则:



    因此修正之后的样本方差的期望是总体方差的一个无偏估计,这就是为什么分母为何要除以n-1。


查看评论

利用动态调用方式实现分布式应用(下)

利用动态调用方式实现分布式应用(下) (本文转载自软件工程专家网www.21cmm.com)苏洋  上一讲介绍了利用动态调用方式实现分布式应用时, 客户端动态调用接口(DII)和服务对象动态骨架接口(...
  • gigix
  • gigix
  • 2002-04-09 09:38:00
  • 1546

为什么样本方差里面要除以(n-1)而不是n?

前段日子重新整理了一下“为什么样本方差里面要除以(n-1)而不是n?”这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的                   ...
  • fuming2021118535
  • fuming2021118535
  • 2016-05-01 14:18:16
  • 32706

彻底理解样本方差为何除以n-1

转载出处:https://blog.csdn.net/hearthougan/article/details/77859173设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式:...
  • u010779707
  • u010779707
  • 2018-04-16 11:42:18
  • 14

为什么样本方差公式中要除以n-1而不是n

在学习概率与数理统计时,我们接触到的比
  • iverain
  • iverain
  • 2014-08-24 17:10:07
  • 5451

求方差时为什么要除以N—1,而不是除以N!【通俗理解-非数学专业】

抽样,实际上也就是通过样本去估计总体,用样本去估计总体。当然就要评估估计的好坏如何,第一个评估方面就是先要评估这个估计是有偏估计还是无偏估计,无偏估计更为有效。该问题就是牵涉到这一点,除以n所得到的样...
  • guomutian911
  • guomutian911
  • 2016-01-24 10:10:44
  • 1176

理解机器学习中的方差

一直没能理解机器学习中方差是什么概念,今天偶然碰见scikit官网的一段程序,让我有了一些深刻的理解。 我们假设要计算回归树在回归问题中的方差,那么方差可以这样描述:...
  • vincent2610
  • vincent2610
  • 2016-12-19 10:25:39
  • 487

为什么计算方差有时候除n,有时候除n-1

首先简单的说法是,除n是因为那是总体样本,而n-1是抽样样本,均值并不是真正的均值,而是样本的均值。...
  • lyc1635566ty
  • lyc1635566ty
  • 2017-07-06 17:22:03
  • 269

协方差的意义和解释(目前为止我看到的最为通俗易懂的文章)

十分感谢原作者的贡献,讲解通俗易懂,感觉有必要让更多人学习到,故转载了这篇博客,附上原文地址 http://blog.sina.com.cn/s/blog_672c5a470100miqq.ht...
  • sh199210
  • sh199210
  • 2016-06-28 18:41:54
  • 1497

PCA的一些理解

最近由于用Haar特征+Adaboost训练分类器时遇到了Haar特征太多导致计算特征空间时内存不足的问题,便想找一些特征降维的方法来缩减特征空间,在网上找了好久也没有找到针对Haar特征有什么有效的...
  • Wiiliam527
  • Wiiliam527
  • 2017-09-04 23:09:06
  • 205

参数估计(个人通俗理解)

问题背景: 我们知道了总体的分布,但不知道分布的参数,因此我们就要对未知的参数做出估计。 两个类型的估计: 1.点估计 2.区间估计 1.点估计 包括矩估计和极大似然估计 1...
  • baidu_29894819
  • baidu_29894819
  • 2017-11-10 18:17:28
  • 304
    个人资料
    等级:
    访问量: 9万+
    积分: 1277
    排名: 4万+
    最新评论