B站白板推导系列笔记——高斯分布——极大似然估计——有偏or无偏

最新推荐文章于 2023-11-10 17:41:17 发布

HIT_NOVA

最新推荐文章于 2023-11-10 17:41:17 发布

阅读量1.1k

点赞数 9

分类专栏：机器学习文章标签：协方差机器学习高斯分布

本文链接：https://blog.csdn.net/weixin_40883049/article/details/103811515

版权

3 篇文章 0 订阅

订阅专栏

首先上大佬视频链接：本篇传送门

高斯分布

一维高斯分布：

$\begin{aligned} X&\sim N(\mu,\sigma^2) \\ f(x) &= \frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2}) \end{aligned} \tag{1}$

其中： $\mu$ 是期望， $\sigma^2$ 是方差
高维高斯分布：
$\begin{aligned} X&\sim N(\bm{\mu},\bm{\Sigma}) \\ f(\bm{x}) &= \frac{1}{(2\pi)^{\frac{d}{2}}|\bm{\Sigma}|^{\frac{1}{2}}}exp(-\frac{1}{2}(\bm{x}-\bm{\mu})^T\bm{\Sigma^{-1}}(\bm{x}-\bm{\mu})) \end{aligned} \tag{2}$

其中 $\bm{x}$ 是 $d$ 维向量， $\bm{\mu}$ 是期望, $\bm{\Sigma}$ 是协方差矩阵

以一维高斯分布为例:
由MLE(最大似然估计)可知:
$\mu_{MLE} = \frac{1}{N}\sum_{i=1}^{N} x_i \tag{3}$

$\sigma_{MLE}^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_{MLE})^2 \tag{4}$

讨论 $\mu_{MLE}$ 的有偏性:
$\begin{aligned} E[\mu_{MLE}] = E[\frac{1}{N}\sum_{i=1}^{N} x_i] = \frac{1}{N}\sum_{i=1}^{N} E[x_i] = \frac{1}{N}\sum_{i=1}^{N} \mu\ = \mu \end{aligned}$
故用MLE对 $\mu$ 的估计是无偏的
讨论 $\sigma_{MLE}^2$ 的有偏性:
$\begin{aligned} E[\sigma_{MLE}^2] &= E[\frac{1}{N} \sum_{i=1}^{N} (x_i - \mu_{MLE})^2] \\ &= \frac{1}{N}\sum_{i=1}^{N} E[(x_i - \mu_{MLE})^2] \\ &= \frac{1}{N}\sum_{i=1}^{N} (E[x_i^2] - E[2\mu_{MLE}x]+E[\mu_{MLE}^2] )\\ &=\frac{1}{N}\sum_{i=1}^{N} (E[x_i^2] - \mu_{MLE}^2 )\\ &=\frac{1}{N}\sum_{i=1}^{N} (E[x_i^2] - \mu^2+\mu^2-\mu_{MLE}^2 )\\ &=\frac{1}{N}\sum_{i=1}^{N} (E[x_i^2] - \mu^2)+\frac{1}{N}\sum_{i=1}^{N}(\mu^2-\mu_{MLE}^2 )\\ &=\frac{1}{N}\sum_{i=1}^{N} (E[x_i^2] - E(x_i)^2)+\frac{1}{N}\sum_{i=1}^{N}(\mu^2-\mu_{MLE}^2 )\\ &=\frac{1}{N}\sum_{i=1}^{N} Var(x_i)+\frac{1}{N}\sum_{i=1}^{N}(\mu^2-\mu_{MLE}^2 )\\ &=Var(x_i)+\frac{1}{N}\sum_{i=1}^{N}(\mu^2-\mu_{MLE}^2 )\\ &=Var(x_i)-\frac{1}{N}\sum_{i=1}^{N}(\mu_{MLE}^2-\mu^2 )\\ &=Var(x_i)-\frac{1}{N}\sum_{i=1}^{N}(E[\mu_{MLE}^2]-E[\mu]^2 )\\ &=Var(x_i)-\frac{1}{N}\sum_{i=1}^{N}(E[\mu_{MLE}^2]-E[\mu_{MLE}]^2 )\\ &=Var(x_i)-\frac{1}{N}\sum_{i=1}^{N}Var(\mu_{MLE})\\ &=Var(x_i)-Var(\mu_{MLE})\\ &=Var(x_i)-Var(\frac{1}{N}\sum_{i=1}^{N} x_i)\\ &=Var(x_i)-\frac{1}{N^2}\sum_{i=1}^{N} Var(x_i)\\ &=Var(x_i)-\frac{1}{N}Var(x_i)\\ &=\frac{N-1}{N}\sigma^2\\ \end{aligned}\\$
可知, $\sigma_{MLE}^2$ 是有偏的

$E[\mu_{MLE}] = \mu, E[\sigma_{MLE}^2] = \frac{N-1}{N}\sigma^2$ , 即对期望的估计无偏,对方差的估计有偏,故若想得到无偏的方差

关注