为什么样本方差要除以n-1

最新推荐文章于 2022-06-21 10:56:24 发布

feliciafay

最新推荐文章于 2022-06-21 10:56:24 发布

阅读量4.7w

点赞数 2

分类专栏： Math 文章标签：生活

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feliciafay/article/details/5878036

版权

Math 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

使用样本来无偏估计总体方差的时候，公式如下：

为什么分母是n-1，而不是n呢？这直觉上不太对。其实，如果分母为n，也可以成为一个估计值，但是它不满足无偏这个条件。仅在除以n-1时才满足无偏这个条件。所以说，关键问题在于“无偏”。那么“无偏”的定义是什么？

如果一个估计量是“无偏”的，那么它的期望就等于真实值。

看到一些书上和网上的资料，有不同的角度。现在按照从感性角度到理性角度的顺序对它们进行整理：

角度一生活实例

样本的容量小于整体，所以有较小的可能性抽中一些极端的数据。比如找来一堆人做样本来测量身高，那么样本中出现巨人的可能性是很小的，这样得到的结果可能就会比实际小。为了弥补这点不足，就把分母变得小一些，这样就更能反应实际数据了。

质疑：这个解释其实不太合理。因为既然可能抽不到高个子，也同样可能抽不到矮个子，所以，分母既然可以变得小一些，也就应该有同样的理由变得大一些。我认为这个角度并不能说明问题。

（经过网友SAMKIDSS指出，其实这个直观的角度定性而不定量地表达了正确的方向，太高或者太矮都会造成更大的方差，抽样得到太高或者太矮的可能性较小，所以分母除以一个比n小的数，来抵消这个差别。

至于为什么是n-1，而不是n-2...，这个角度无法进行解释。）

角度二自由度

自由度指的是等式中能够自由取值的变量的个数，如果有n个数能够自由取值，那么自由度就为n。

在公式①中， X_i有n个可取的值，所以X_i的自由度为n，但是，它接着还减去了，而代表了样本中第1到第n个数值的平均值。那么，其实相当于增加了一个限制条件，原来的自由度要减去1，得n-1。(可以这样理解，如果自由度仍为n，那么n个数可以随意取值的情况下，是不能得到一个确定的均值的。或者说，一堆数，如果知道了均值，那么其实只需要知道另外的n-1个数，这堆数中的每个数都确定了)

角度三公式推导

参考高教《概率论与数理统计》第168页。首先，

这是对公式本身的化简。现在，求S²的期望

其中，μ和σ 分别是总体X的均值和方差。

并且，倒数第二步,两次运用了下面这个方差的性质：

D(X)=E(X²)-[E(X)]²

角度4 依然公式推导

依然是公式推导，过程有小区别。在这里有详细描述。
其中，原文中谈到“关于第二部分和第三部分，实际上有...”后紧跟着的公式那里，我一开始没有看懂，请教老师后发现。过程是这样的：

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
11
评论
为什么样本方差要除以n-1

使用样本来无偏估计总体方差的时候，公式如下：为什么分母是n-1，而不是n呢？这直觉上不太对。其实，如果分母为n，也可以成为一个估计值，但是它不满足无偏这个条件。仅在除以n-1时才满足无偏这个条件。所以说，关键问题在于“无偏”。那么“无偏”的定义是什么？如果一个估计量是“无偏”的，那么它的期望就等于真实值。看到一些书上和网上的资料，有不同的角度。现在按照从感性角度到理性角度的顺序对它们进行整理：角度一生活实例样本的容量小于整体，所以有较小的可能性抽中一些极端的数据。比如找来一堆人做样本来测量身高，
复制链接

扫一扫

专栏目录

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。