样本方差分母为什么是n-1？——无偏估计

teengad

已于 2022-07-16 01:44:42 修改

阅读量1.9k

点赞数 2

分类专栏：科研笔记文章标签：样本方差无偏估计

于 2022-06-05 02:14:35 首次发布

本文链接：https://blog.csdn.net/qq_32515081/article/details/125127849

版权

科研笔记专栏收录该内容

47 篇文章 15 订阅

订阅专栏

文章目录

1 总体方差和样本方差

首先要分清总体和样本:

总体：研究对象的整个群体
比如总共10名玩家的年龄。
样本：总体的一个子集
比如其中5名队员玩家的年龄。

方差（Variance），衡量随机变量或一组数据离散程度的度量。根据总体和样本的区别分为总体方差和样本方差两种。

总体方差定义为：

$\sigma^{2}=\frac{\sum_{i=1}^{n}(X_{i}-\mu)^{2}}{n}$

样本方差被定义为：

$S^{2}=\frac{\sum_{i=1}^{n}(X_{i}-\bar{x})^{2}}{n-1}$

在实际应用中是通过在总体中取样本，用其样本均值和样本方差 $S^{2}$ 来估计总体的均值 $\sigma^{2}$ ：

$S^{2}\rightarrow\sigma^{2}$

但是这样会产生一个问题，这两个在什么情况下能够等价？

下面举一个例子，假设我们抽取一个样本包含三个数据点： $x_{1},x_{2},x_{3}$ ，然后我们可以计算它的方差，当然这个方差还是除以 $n$ 意义下的方差：

$\begin{aligned} S^{2} &=\frac{(x_{1}-\mu)^{2}+(x_{2}-\mu)^{2}+(x_{3}-\mu)^{2}}{3}\\ &=\frac{3}{n}\mu^{2}-2\frac{x_{1}+x_{2}+x_{3}}{3}\mu+\frac{x_{1}^{2}+x_{2}^{2}+x_{3}^{2}}{3} \end{aligned}$

由上可见这是一个二次函数，我们可以将其画出来：

上图中，横坐标为均值 $\mu$ ，纵坐标为方差 $S^{2}$ 。当均值在变动的时候，方差也随之变化：

方差最小的地方对应的值为：

$\frac{b}{-2a}=\frac{-2\frac{x_{1}+x_{2}+x_{3}}{3}}{-2\frac{3}{3}}=\bar{x}$

所以发现用样本均值算出的样本方差 $S^{2}$ 是其所有可能取值的下限。所以有关系：

$\frac{\sum(x-\bar{x})^{2}}{n}<\frac{\sum(x-\mu)^{2}}{N}$

其中 $n$ 为样本个数， $N$ 为总体个数，或者：

$\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}<\sum_{i=1}^{n}(X_{i}-\mu)^{2}$

这里需要分析一下是哪种情况？？？？？？

这会导致：

$S^{2}=\frac{\sum_{i=1}^{n}(X_{i}-\bar{x})^{2}}{n}<\sigma^{2}=\frac{\sum_{i=1}^{n}(X_{i}-\mu)^{2}}{n}$

所以直观来说需要调节 $S^{2}$ 中的分母的大小（调小）。

2 方差的无偏估计

无偏估计

当我们用样本统计量来估计总体参数时，如果估计量的数学期望等于被估计参数的真实值，我们该估计量为被估计参数的无偏估计，即具有无偏性，是一种用于评价估计量优良性的准则。

而在这里我们就是希望：

$E(S^{2})=\sigma^{2}$

假设总体有10个数据，然后我们抽取5个数据来计算方差 $S_{1}^{2}$ ，然后重复这个步骤，最终得到 $S_{1}^{2},S_{2}^{2},\cdots,S_{252}^{2}$ ，然后我们希望：

$E(S_{i}^{2})=\frac{S_{1}^{2}+S_{2}^{2}+\cdots+S_{252}^{2}}{252}=\sigma^{2}$

即用样本的方差去估计真实的总体方差

公式推导

$\begin{aligned} E(S^{2}) &=E\left(\frac{\sum_{i=1}^{n}(X_{i}-\bar{x})^{2}}{n-1}\right)\\ &=\frac{1}{n-1}E\left(\sum_{i=1}^{n}(X_{i}-\bar{x})^{2}\right)\\ &=\frac{1}{n-1}E\left(\sum_{i=1}^{n}((X_{i}-\mu)+(\mu-\bar{x}))^{2}\right)\\ &=\frac{1}{n-1}E\left(\sum_{i=1}^{n}\left((X_{i}-\mu)^{2}+2(X_{i}-\mu)(\mu-\bar{x})+(\mu-\bar{x})^{2}\right)\right)\\ \end{aligned}$

1）其中上式的第一项可以化简为：

$\sigma^{2}=\frac{\sum_{i=1}^{n}(X_{i}-\mu)^{2}}{n}\rightarrow n\sigma^{2}=\sum_{i=1}^{n}(X_{i}-\mu)^{2}$

由于 $n\sigma^{2}$ 为常数，则：

$\frac{1}{n-1}E\left(\sum_{i=1}^{n}(X_{i}-\mu)^{2}\right)=\frac{1}{n-1}E(n\sigma^{2})=\frac{n}{n-1}\sigma^{2}$

2）前式第二项可以化简为：

$\begin{aligned} &\ \ \ \ \ \frac{1}{n-1}E\left(\sum_{i=1}^{n}2(X_{i}-\mu)(\mu-\bar{x})\right)\\ &=\frac{2}{n-1}E\left((\mu-\bar{x})\left(\sum_{i=1}^{n}(X_{i}-\mu)\right)\right)\\ &=\frac{2}{n-1}E\left((\mu-\bar{x})\left(\sum_{i=1}^{n}X_{i}-n\mu\right)\right)\\ &=\frac{2}{n-1}E\left((\mu-\bar{x})\left(n\bar{x}-n\mu\right)\right)\\ &=-\frac{2n}{n-1}E\left((\mu-\bar{x})^{2}\right)\\ \end{aligned}$

3）第三项可以化简为：

$\begin{aligned} &\ \ \ \ \ \frac{1}{n-1}E\left(\sum_{i=1}^{n}(\mu-\bar{x})^{2}\right)\\ &=\frac{n}{n-1}E\left((\mu-\bar{x})^{2}\right)\\ \end{aligned}$

4）合并第二项和第三项得：

$-\frac{n}{n-1}E\left((\mu-\bar{x})^{2}\right)\\$

而

$\begin{aligned} &\ \ \ \ \ E\left((\mu-\bar{x})^{2}\right)\\ &=E\left(\left(\frac{1}{n}\sum_{i=1}^{n}x_{i}-\frac{1}{n}n\mu\right)^{2}\right)\\ &=\frac{1}{n^{2}}E\left(\left(\sum_{i=1}^{n}x_{i}-n\mu\right)^{2}\right)\\ &=\frac{1}{n^{2}}E\left(\left(\sum_{i=1}^{n}x_{i}-E\left(\sum_{i=1}^{n}x_{i}\right)\right)^{2}\right)\\ \end{aligned}$

此时将 $\sum_{i=1}^{n}x_{i}$ 看作变量，则：

$E\left(\left(\sum_{i=1}^{n}x_{i}-E\left(\sum_{i=1}^{n}x_{i}\right)\right)^{2}\right)=var\left(\sum_{i=1}^{n}x_{i}\right)$

当 $x_{i}$ 之间是相互独立的时候：

$var\left(\sum_{i=1}^{n}x_{i}\right)=\sum_{i=1}^{n}var\left(x_{i}\right)$

所以：

$E\left(\left(\sum_{i=1}^{n}x_{i}-E\left(\sum_{i=1}^{n}x_{i}\right)\right)^{2}\right)=\sum_{i=1}^{n}var\left(x_{i}\right)=\sum_{i=1}^{n}\sigma^{2}$

所以：

$\begin{aligned} &\ \ \ \ \ E\left((\mu-\bar{x})^{2}\right)\\ &=\frac{1}{n^{2}}E\left(\left(\sum_{i=1}^{n}x_{i}-E\left(\sum_{i=1}^{n}x_{i}\right)\right)^{2}\right)\\ &=\frac{1}{n^{2}}\sum_{i=1}^{n}\sigma^{2}\\ &=\frac{1}{n}\sigma^{2}\\ \end{aligned}$

所以：

$-\frac{1}{n-1}E\left((\mu-\bar{x})^{2}\right)=-\frac{n}{n-1}\frac{1}{n}\sigma^{2}=-\frac{1}{n-1}\sigma^{2}$

5）所以原式得：

$\begin{aligned} E(S^{2}) &=\frac{n}{n-1}\sigma^{2}-\frac{1}{n-1}\sigma^{2}\\ &=\sigma^{2} \end{aligned}$

由此证毕。

3 从自由度角度理解样本方差为什么除以 $n - 1$ ？

现在从自由度的角度解释为何样本方差为什么除 $n - 1$ 。首先明确自由度的概念：自由度（degree of freedom，df）指的是计算某一统计量时，取值不受限制的变量个数，比如取三个变量 $x, y, z$ ，然后计算平均值为 $\frac{x+y+z}{3}$ ，则此时自由度为3个。但是给定约束 $x + y + z = 10$ 之后，假设 $x, y$ 为自由变量，则此时 $z$ 不再是自由变量，平均值的自由度降为2个。

应用在样本方差的公式中：

$S^{2}=\frac{\sum_{i=1}^{n}(X_{i}-\bar{x})^{2}}{n}$

假设抽取三个数据，其中 $\bar{x}=\frac{x_{1}+x_{2}+x_{3}}{3}$ ，则计算方差的公式的分母 $(x_{1}-\bar{x})^{2}+(x_{2}-\bar{x})^{2}+(x_{3}-\bar{x})^{2}$ 的自由度不再是3个，而应该是2个，应为当给定 $x_{1},x_{2}$ 或者其中两项时， $(x_{3}-\bar{x})^{2}$ 已经确定了。

值得注意的是，这里样本方差分母上的自由度不再是变量的自由度，而是以 $(x_{i}-\bar{x})^{2}$ 的自由度，否则的话，变量的自由度依旧为3不变！

所以当样本量为 $n$ 的时候，计算样本方差需要除以自由度 $n - 1$ 。

统计量	自由度	公式
样本平均数	$n$	$\frac{\sum_{i=1}^{n}x_{i}}{n}$
样本方差	$n - 1$	$\frac{\sum_{i=1}^{n}(X_{i}-\bar{x})^{2}}{n-1}$
一元回归	$n - 2$	$\hat{\sigma}^{2}=\frac{\sum_{i=1}^{n}e_{i}^{2}}{n-2}$
多元回归	$n - k - 1$	$\hat{\sigma}^{2}=\frac{\sum_{i=1}^{n}e_{i}^{2}}{n-k-1}$