无偏估计的数学证明和分析

最近学习PCA,在求最大化方差 σ 2 = 1 P − 1 ∑ k = 1 P ( v T ( x k − μ ) ) 2 − λ ( ∥ v ∥ 2 − 1 ) \sigma^{2} = \frac{1}{P-1} \sum_{k=1}^{P}(v^{T}(x_{k}-\mu ))^{2}-\lambda(\left \| v \right \|^{2}-1) σ2=P11k=1P(vT(xkμ))2λ(v21) 时遇到了无偏估计的问题——为什么是P-1而不是P?整理了一些笔记写上来供参考,有错误的地方望批评指正。

简单理解

首先我们了解下无偏估计的定义:
估计量的数学期望等于被估计参数的真实值,则此估计量为被估计参数的无偏估计。

乍一看很绕口,我们从现实中的简单例子去解释会更好理解。
如果我们想知道一个城市人口的平均高度,我们可以通过采集该城市所有人的身高并计算平均值,这样得到的就是无偏的平均身高。
但实际情况是,出于成本考虑,我们不太可能去测量所有人的身高,于是我们通过采样来估计实际的平均身高。于是我们应用了随机采样等方法,而这些方法虽然没法准确地估计该城市的平均身高,但不同的采样方法均在真实平均身高附近波动,那么我们就可以说这个估计是无偏的。

类似的,我们用一下以下算法去估计总体方差:
s 2 = 1 n ∑ i = 1 n ( x i − x ˉ ) 2 s^{2} = \frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2} s2=n1i=1n(xixˉ)2

以芯靶图为例,如果我们用n代入计算得到的预测值会偏离靶图中心;而用n计算,得到的值会在靶图中心。
在这里插入图片描述
在这里插入图片描述

数学证明及解析

将公式展开计算如下:
s 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n − 1 E ( s 2 ) = E ( ∑ i = 1 n ( x i − x ˉ ) 2 n − 1 ) = 1 n − 1 E [ ∑ i = 1 n ( x i − x ˉ ) 2 ] = 1 n − 1 E [ ∑ i = 1 n [ ( x i − μ ) − ( x ˉ − μ ) ] 2 ] \begin{aligned} & s^{2} = \frac{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}}{n-1}\\ & E(s^{2}) = E(\frac{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}}{n-1})\\ &= \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}]\\ &= \frac{1}{n-1}E[\sum_{i=1}^{n}[(x_{i}-\mu) - (\bar{x}-\mu)]^{2}] \end{aligned} s2=n1i=1n(xixˉ)2E(s2)=E(n1i=1n(xixˉ)2)=n11E[i=1n(xixˉ)2]=n11E[i=1n[(xiμ)(xˉμ)]2]

E [ ∑ i = 1 n [ ( x i − μ ) − ( x ˉ − μ ) ] 2 ] E[\sum_{i=1}^{n}[(x_{i}-\mu) - (\bar{x}-\mu)]^{2}] E[i=1n[(xiμ)(xˉμ)]2] E [ ∑ i = 1 n ( x i − x ˉ ) 2 ] E[\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}] E[i=1n(xixˉ)2]加一个 μ \mu μ括号里面再减一个 μ \mu μ得到。展开得到:

= 1 n − 1 E [ ∑ i = 1 n ( x i − μ ) 2 − 2 ∑ i = 1 n ( x i − μ ) ( x ˉ − μ ) + ∑ i = 1 n ( x ˉ − μ ) 2 ] = 1 n − 1 E [ ∑ i = 1 n ( x i − μ ) 2 − 2 ( x ˉ − μ ) ∑ i = 1 n ( x i − μ ) + ∑ i = 1 n ( x ˉ − μ ) 2 ] = 1 n − 1 E [ ∑ i = 1 n ( x i − μ ) 2 − n ( x ˉ − μ ) 2 ] = 1 n − 1 ( ∑ i = 1 n E ( x i − μ ) 2 − n E [ ( x ˉ − μ ) 2 ] ) = 1 n − 1 ( ∑ i = 1 n σ x i 2 − n σ x ˉ 2 ) \begin{aligned} & = \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\mu)^{2} - 2\sum_{i=1}^{n}(x_{i}-\mu)(\bar{x}-\mu) + \sum_{i=1}^{n}(\bar{x}-\mu)^{2}]\\ & = \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\mu)^{2} - 2(\bar{x}-\mu)\sum_{i=1}^{n}(x_{i}-\mu) + \sum_{i=1}^{n}(\bar{x}-\mu)^{2}]\\ & = \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\mu)^{2} - n(\bar{x}-\mu)^{2}]\\ & = \frac{1}{n-1}(\sum_{i=1}^{n}E(x_{i}-\mu)^{2} - nE[(\bar{x}-\mu)^{2}])\\ & = \frac{1}{n-1}(\sum_{i=1}^{n}\sigma_{x_{i}}^{2} - n\sigma_{\bar{x}}^{2})\\ \end{aligned} =n11E[i=1n(xiμ)22i=1n(xiμ)(xˉμ)+i=1n(xˉμ)2]=n11E[i=1n(xiμ)22(xˉμ)i=1n(xiμ)+i=1n(xˉμ)2]=n11E[i=1n(xiμ)2n(xˉμ)2]=n11(i=1nE(xiμ)2nE[(xˉμ)2])=n11(i=1nσxi2nσxˉ2)

其中, x ˉ − μ \bar{x}-\mu xˉμ是个数所以能够被从求和符号内提出来。

又因为 σ x i 2 = σ 2 \sigma_{x_{i}}^{2}=\sigma^{2} σxi2=σ2,且 σ x ˉ 2 = σ 2 n \sigma_{\bar x}^{2}=\frac{\sigma^{2}}{n} σxˉ2=nσ2,因此:

= 1 n − 1 ( n σ 2 − σ 2 ) = 1 n − 1 ( n − 1 ) σ 2 = σ 2 \begin{aligned} &=\frac{1}{n-1}(n\sigma^{2}-\sigma^{2})\\ &=\frac{1}{n-1}(n-1)\sigma^{2}\\ &=\sigma^{2} \end{aligned} =n11(nσ2σ2)=n11(n1)σ2=σ2

因此 E ( s 2 ) E(s^{2}) E(s2) σ 2 \sigma^{2} σ2的无偏估计量。

Reference

https://www.zhihu.com/question/22983179
https://www.youtube.com/watch?v=wlcvRrYKkx8

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值