机器学习基础：极大似然估计高斯参数

HanZee

已于 2022-09-25 13:02:00 修改

阅读量1k

点赞数 2

分类专栏：机器学习

于 2022-03-19 20:13:54 首次发布

本文链接：https://blog.csdn.net/qq_18555105/article/details/123588308

版权

机器学习专栏收录该内容

27 篇文章 4 订阅

订阅专栏

机器学习基础：极大似然估计

数据

设DataSet：X={(x1,y1),(x2,y2),(x3,y3)…(xn,yn))}，其中 $\in R^p$ ， $\in R$ ,也就是说X= $x1,x2,x3.....xn）^T$ ，其中这里，每个元素x
都是一个p维的列向量，我们继续化简，X= $\left[ \begin{matrix} x_{11} & x_{12} &... x_{1p} \\ x_{21} & x_{22} &... x_{2p} \\ \\...... \\x_{n1} & x_{n2} &... x_{_{np}} \end{matrix} \right]\tag{1}$
Y= $\left[ \begin{matrix} y_{1} \\ y_{2} \\ \\...... \\y_n \end{matrix} \right]\tag{2}$

$x_i\in R^p$ ,每个元素x_i服从独立同分布,本文当中，为了方便计算，我们令p=1。设 $\theta=(\mu,\sigma^2)$ 一维标准高斯分布的pdf（概率密度函数）： $P(X|\theta) = \frac{1}{\sigma \sqrt{2\Pi}}+exp(-\frac{(X-\mu)^2}{2\sigma^2})$

参数估计均值

$\ln\theta _{MLE}=argmax \ln P(X|\theta)$
$=argmax\prod_{i=1}^N \ln P(x_i|\theta)$
$argnax\ln\sum_{i=1}^NP(xi|\theta)$
$=argmax\ln\sum_{i=1}^N(\frac{1}{\sigma \sqrt{2\Pi}}+exp(-\frac{(x_i-\mu)^2}{2\sigma^2}))$
$=argmax\sum_{i=1}^N(\ln\frac{1}{\sqrt2\Pi}-\ln\sigma-\frac{(x_i-\mu)^2}{2\sigma^2})))$
化简到这里，我们的目标函数 $L(\theta)$ 就化简完成了。
下面我们分别对 $\mu,\sigma$ 进行参数估计。
$\ln\mu_{MLE}= =argmax\sum_{i=1}^N(\ln\frac{1}{\sqrt2\Pi}-\ln\sigma-\frac{(x_i-\mu)^2}{2\sigma^2})))$
因为其他两项都和系数 $\mu$ 无关，在求解偏导数的时候可以约去，所以：
$\ln\mu_{MLE}=argmax\sum_{i=1}^N-\frac{(x_i-\mu)^2}{2\sigma^2}$
$=argmin\sum_{i=1}^N(x_i-\mu)^2$
$=\frac{\partial}{\partial \mu}\sum_{i=1}^N(x_i^2-2x_i\mu+\mu^2)=0$
$=\sum_{i=1}^N(-2x_i+2\mu)=0$
$\sum_{i=1}^Nx_i=N\mu$
$\mu_{MLE}=\frac{1}{N}\sum_{i=1}^Nx_i$
因为
$E[\mu_{MLE}]=\frac{1}{N}\sum_{i=1}^NE[x_i]=\frac{1}{N}\sum_{i=1}^N\mu=\mu$
所以此结果为无偏估计

参数估计方差

我们上面求出来的L(X)带入到这里
$\ln\theta _{MLE}=argmax \ln P(X|\theta)$
$=argmax\prod_{i=1}^N \ln P(x_i|\theta)$
$argnax\ln\sum_{i=1}^NP(xi|\theta)$
$=argmax\ln\sum_{i=1}^N(\frac{1}{\sigma \sqrt{2\Pi}}+exp(-\frac{(x_i-\mu)^2}{2\sigma^2}))$
$=argmax\sum_{i=1}^N(\ln\frac{1}{\sqrt2\Pi}-\ln\sigma-\frac{(x_i-\mu)^2}{2\sigma^2})$

$\sigma^2_{MLE}=argmax\sum_{i=1}^N(\ln\frac{1}{\sqrt2\Pi}-\ln\sigma-\frac{(x_i-\mu)^2}{2\sigma^2})$
$=\frac{\partial}{\partial \sigma}\sum_{i=1}^N(\frac{1}{\sqrt2\Pi}-\ln\sigma-\frac{(x_i-\mu)^2}{2\sigma^2})=0$
$=\sum_{i=1}^N(-\frac{1}{\sigma}-(-2)\sigma^{-3}\frac{(x_i-\mu)^2} {2})=0$
左右同时✖️ $\sigma^3$
$=\sum_{i=1}^N((-\sigma)^2+(x_i-\mu)^2)=0$
$\sigma^2_{MLE}=\frac{1}{N}\sum_{i=1}^N(x_i-\mu)^2=0$
$因为E[\sigma_{MLE}^2]=\frac{N-1}{N}\sigma^2$
所以此结果为有偏估计

HanZee

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习基础：极大似然估计高斯参数

机器学习基础：极大似然估计数据参数估计均值参数估计方差数据设DataSet：X={(x1,y1),(x2,y2),(x3,y3)…(xn,yn))}，其中xi∈Rpxi \in R^pxi∈Rp，yi∈Ryi \in Ryi∈R,也就是说X=（x1,x2,x3.....xn）T（x1,x2,x3.....xn）^T（x1,x2,x3.....xn）T，其中这里，每个元素x都是一个p维的列向量，我们继续化简，X=[x11x12...x1px21x22...x2p......xn1xn2...xnp](1
复制链接

扫一扫