机器学习-白板推导 P2_1

最新推荐文章于 2023-07-29 14:09:01 发布

无知书童

最新推荐文章于 2023-07-29 14:09:01 发布

阅读量221

点赞数

分类专栏： # 机器学习白板推导文章标签：一维高斯分布

本文链接：https://blog.csdn.net/qq_28404829/article/details/100554248

版权

机器学习白板推导专栏收录该内容

25 篇文章 1 订阅

订阅专栏

机器学习-白板推导 P2_1

一维高斯分布：
参数有偏无偏推导

一维高斯分布：

高斯分布

$\begin{aligned} & X:data \rightarrow X=(x_1 \; x_2 \; ...\;x_N)^T_{N \times p} \\ & x_i \in R^p \\ & x_i \sim^{iid} N(\mu, \Sigma) \\ & \theta = (\mu, \Sigma) \end{aligned}$

一维高斯分布：

$\frac{1}{\sqrt{2 \pi} \sigma} \exp \left( - \frac{(x - \mu)^2}{2 \sigma ^ 2} \right)$

p维高斯分布：

$\frac{1}{{2 \pi}^{\frac{p}{2}} } \exp \left( - \frac{1}{2} (x - \mu)^T \Sigma^{-1 } (x - \mu) \right)$

参数值公式推导

$\theta_{MLE} = arg\max_\theta \log p(x|\theta)$
令 $p = 1$ , $\theta=(\mu,\sigma^2)$
$\begin{aligned} \log p(x|\theta) &= \log \prod_{i=1}^N p(x_i|\theta) \\ & = \sum_{i=1}^N \log p(x_i|\theta) \\ & = \sum_{i=1}^N \log \frac{1}{\sqrt{2 \pi} \sigma} \exp \left( - \frac{(x_i - \mu)^2}{2 \sigma ^ 2} \right) \\ & = \sum_{i=1}^N \left[ \log \frac{1}{\sqrt{2 \pi}} + \log \frac{1}{\sigma} - \frac{(x_i - \mu)^2}{2 \sigma^2} \right] \end{aligned}$
求 $\mu$ :
$\begin{aligned} \mu_{MLE} &= arg \max_{\mu} \log p(x|\theta) \\ &= arg \max_{\mu} \sum_{i=1}^N - \frac{(x_i - \mu)^2}{2 \sigma^2} \\ & = arg \min_{\mu} \sum_{i=1}^N (x_i - \mu)^2 \end{aligned}$
$\begin{aligned} \frac {\partial}{\partial \mu} \sum_{i=1}^N (x_i - \mu)^2 &= \sum_{i=1}^N 2*(x_i - \mu)*(-1) = 0 \\ \sum_{i=1}^N (x_i - \mu) &= 0 \\ \sum_{i=1}^N x_i - \sum_{i=1}^N \mu &= 0 \end{aligned}$
$\mu_{MLE} = \frac{1}{N}\sum_{i=1}^N x_i$

求 $\sigma^2$ :
$\begin{aligned} \sigma^2_{MLE} &= arg \max_{\sigma} \log p(x|\theta) \\ & = arg \max_{\sigma} \sum_{i=1}^N \left( \log \frac{1}{\sigma} - \frac{(x_i - \mu)^2}{2 \sigma^2} \right) \end{aligned}$
$\begin{aligned} \frac {\partial}{\partial \sigma} \sum_{i=1}^N \left( \log \frac{1}{\sigma} - \frac{(x_i - \mu)^2}{2 \sigma^2} \right) &= \sum_{i=1}^N \left( -\frac{1}{\sigma} + (x_i - \mu)^2 * \sigma^{-3} \right) = 0 \\ \sum_{i=1}^N \left( -{\sigma}^{-2} + (x_i - \mu)^2 \right) &= 0 \\ -\sum_{i=1}^N \sigma^2 + \sum_{i=1}^N (x_i - \mu)^2 &= 0 \\ \sum_{i=1}^N \sigma^2 = \sum_{i=1}^N (x_i - \mu)^2 \end{aligned}$
$\sigma^2_{MLE} = \frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2$

参数有偏无偏推导

$\mu_{MLE}$ 为无偏估计
$E[\mu_{MLE}]=\frac{1}{N}\sum_{i=1}^NE[x_i]=\frac{1}{N}\sum_{i=1}^N\mu=\mu$

$\begin{aligned} Var[\mu_{MLE}] &= Var[\frac{1}{N} \sum_{i=1}^N x_i]=\frac{1}{N^2} \sum_{i=1}^N Var[x_i] \\ &=\frac{1}{N^2} \sum_{i=1}^N \sigma^2 = \frac{1}{N^2} N\sigma^2 = \frac{1}{N}\sigma^2 \end{aligned}$

$\sigma^2_{MLE}$ 为有偏估计。
无偏估计值应为：
$E[\sigma^2_{MLE}]=\frac{N-1}{N}\sigma^2 \; \; \; \; \; \; \hat{\sigma}=\frac{1}{N-1}\sum_{i=1}^N (x_i - \mu)^2$
$\sigma^2_{MLE}$ 公式推导：
$\begin{aligned} \sigma^2_{MLE} &= \frac{1}{N}\sum_{i=1}^N (x_i - \mu_{MLE})^2 \\ & = \frac{1}{N}\sum_{i=1}^N (x_i^2 - 2x_i\mu_{MLE}+\mu_{MLE}^2) \\ &= \frac{1}{N}\sum_{i=1}^N x_i^2 - \frac{1}{N}\sum_{i=1}^N 2x_i\mu_{MLE} + \frac{1}{N} \sum_{i=1}^N \mu_{MLE}^2 \\ &= \frac{1}{N}\sum_{i=1}^N x_i^2 - \mu_{MLE}^2 \end{aligned}$
$\begin{aligned} E[\sigma^2_{MLE}] &=E[ \frac{1}{N}\sum_{i=1}^N x_i^2 - \mu_{MLE}^2] \\ &=E[(\frac{1}{N}\sum_{i=1}^N x_i^2 - \mu^2)-( \mu_{MLE}^2 - \mu^2)] \\ &= E[\frac{1}{N}\sum_{i=1}^N x_i^2 - \mu^2] - E[ \mu_{MLE}^2 - \mu^2] \end{aligned}$
$\begin{aligned} E[\frac{1}{N}\sum_{i=1}^N x_i^2 - \mu^2] &= E[\frac{1}{N}\sum_{i=1}^N (x_i^2 - \mu^2)] \\ &= \frac{1}{N} \sum_{i=1}^N E[(x_i^2 - \mu^2)] \\ &= \frac{1}{N} \sum_{i=1}^N (E[x_i^2] - \mu^2) \\ &= \frac{1}{N} \sum_{i=1}^N (Var[x_i]) \\ &= \frac{1}{N} \sum_{i=1}^N (\sigma^2) \\ & = \sigma^2 \end{aligned}$
$\begin{aligned} E[ \mu_{MLE}^2 - \mu^2] &= E[\mu_{MLE}^2] - E[ \mu^2] \\ &= E[\mu_{MLE}^2] - \mu^2 \\ &= E[\mu_{MLE}^2] - {E[\mu _{MLE}]}^2 \\ & = Var[\mu _{MLE}] \\ & = \frac{1}{N} \sigma ^ 2 \end{aligned}$
$E[\sigma^2_{MLE}] = \sigma ^ 2 - \frac{1}{N} \sigma ^ 2 = \frac{N-1}{N} \sigma ^ 2$

B站链接：
https://www.bilibili.com/video/av32905863?from=search&seid=8309397892501615322

无知书童

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-白板推导 P2_1

机器学习-白板推导 P2概率知识补充高斯分布一维高斯分布：p维高斯分布：参数值公式推导参数有偏无偏推导概率知识补充高斯分布X:data→X=(x1&ThickSpace;x2&ThickSpace;...&ThickSpace;xN)N×pTxi∈Rpxi∼iidN(μ,Σ)θ=(μ,Σ)\begin{aligned}&amp; X:data \right...
复制链接

扫一扫

专栏目录