李航《统计学习方法》EM算法导出，式9.13详细推导

最新推荐文章于 2021-08-11 18:19:33 发布

莫叶何竹

最新推荐文章于 2021-08-11 18:19:33 发布

阅读量771

点赞数 3

分类专栏：李航《统计学习方法》学习笔记文章标签： EM算法推导李航统计学习方法

本文链接：https://blog.csdn.net/weixin_40779727/article/details/97900280

版权

李航《统计学习方法》学习笔记专栏收录该内容

0 篇文章 0 订阅

订阅专栏

感觉书中对式子9.13的推导不严谨，补充式子（9-13）完整推导：
对于观测数据Y（不完全数据）关于参数 θ 的对数似然函数：
$\begin{aligned} L(\theta) &=\log P(Y | \theta)=\log \sum_{Z} P(Y, Z | \theta) \\ &=\log \left(\sum_{Z} P(Y | Z, \theta) P(Z | \theta)\right) \end{aligned}$
为了通过迭代的方法找出该极大似然函数，我们希望新的估计值θ能使*L(θ)*增加，即
$L(\theta)>L\left(\theta^{(i)}\right)$
为此，考虑两者的差
$L(\theta)-L\left(\theta^{(i)}\right) = \log \left(\sum_{Z} P(Y | Z, \theta) P(Z | \theta)\right)-\log P\left(Y | \theta^{(i)}\right) \\ =\log \left(\frac{\sum_{Z} P(Y | Z, \theta) P(Z | \theta)}{P\left(Y | \theta^{(i)}\right)}\right) \\ =\log \left(\sum_{Z} \frac{P(Y | Z, \theta) P(Z | \theta)}{P\left(Y | \theta^{(i)}\right)}\right) \\ =\log \left(\sum_{Z}P(Z|Y,\theta^{(i)}) \frac{P(Y | Z, \theta) P(Z | \theta)}{P\left(Y | \theta^{(i)}\right)P(Z|Y,\theta^{(i)})}\right)$
根据Jenson不等式，有
$L(\theta)-L\left(\theta^{(i)}\right)=\log \left(\sum_{Z}P(Z|Y,\theta^{(i)}) \frac{P(Y | Z, \theta) P(Z | \theta)}{P\left(Y | \theta^{(i)}\right)P(Z|Y,\theta^{(i)})}\right) \\ \geq \sum_{Z}P(Z|Y,\theta^{(i)}) \log \left(\frac{P(Y | Z, \theta) P(Z | \theta)}{P\left(Y | \theta^{(i)}\right)P(Z|Y,\theta^{(i)})} \right)$
接下来的过程书本很详细了。

附注：Jenson不等式有限形式

若 $\Omega$ 是有限集合 $\left\{x_{1}, x_{2}, \ldots, x_{n}\right\}$ ，而 $\mu$ 是 $\Omega$ 上的正规计数测度，则不等式的一般形式可以简单地用和式表示：
$\varphi\left(\sum_{i=1}^{n} g\left(x_{i}\right) \lambda_{i}\right) \leq \sum_{i=1}^{n} \varphi\left(g\left(x_{i}\right)\right) \lambda_{i}$
其中 $\lambda_{1}+\lambda_{2}+\cdots+\lambda_{n}=1, \lambda_{i} \geq 0$
若 $\varphi$ 是凹函数，只需把不等式符号调转

参考链接

莫叶何竹

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
5
评论
李航《统计学习方法》EM算法导出，式9.13详细推导

感觉书中对式子9.13的推导不严谨，补充式子（9-13）完整推导：对于观测数据Y（不完全数据）关于参数 θ 的对数似然函数：L(θ)=log⁡P(Y∣θ)=log⁡∑ZP(Y,Z∣θ)=log⁡(∑ZP(Y∣Z,θ)P(Z∣θ))\begin{aligned} L(\theta) &amp;=\log P(Y | \theta)=\log \sum_{Z} P(Y, Z | \the...
复制链接

扫一扫