《统计学习方法》笔记——EM公式推导

最新推荐文章于 2023-03-09 22:01:42 发布

惊了，还能这样？

最新推荐文章于 2023-03-09 22:01:42 发布

阅读量319

点赞数

分类专栏：《统计学习方法》笔记文章标签： EM算法公式推导

本文链接：https://blog.csdn.net/qq_30280273/article/details/102409211

版权

文章目录

EM算法
- 问题描述
- 算法导出
GMM模型
- GMM模型描述
- 使用EM算法估计GMM

EM算法

问题描述

EM算法是一种利用数据估计生成模型的算法。即求解目标为数据满足的概率模型。
假设观测变量为 $Y=\{y_1,y_2,\dots,y_N\}$ ，隐藏变量为 $Z$ ，估计参数为 $\theta$ 。
根据最大似然估计的思想，很自然的想法就是寻找合适的参数 $\theta$ ，使得取得观测值的概率最大。
$\arg \max_\theta P(Y|\theta)\tag{1}$
一般我们认为样本之间独立同分布，因此有
$P(Y|\theta)=\prod_{j=1}^NP(y_j|\theta)\tag{2}$
为了方便运算，一般将 $(1)$ 式改写为如下形式
$\arg \max_\theta \log P(Y|\theta)\tag{3}$
由于隐藏变量的存在，这个最值问题无法直接求解，因此使用EM算法来迭代

算法导出

首先定义 $L(\theta)$
$L(\theta) \triangleq \log P(Y|\theta) \tag{4}$
迭代过程中我们希望求得的 $\theta^{(1)},\theta^{(2)},\cdots,\theta^{(i)},\cdots$ 保证 $L(\theta)$ 能够单调递增。为此，考虑 $L(\theta)-L(\theta^{(i)})$
$\begin{aligned} L(\theta)-L(\theta^{(i)}) & = \log(P(Y|\theta))-\log(P(Y|\theta^{(i)}))\\ & =\log(P(Y|Z,\theta)P(Z|\theta))-\log(P(Y|\theta^{(i)}))\\ &=\log(P(Z|Y,\theta^{(i)})\frac{P(Y|Z,\theta)P(Z|\theta)}{P(Z|Y,\theta^{(i)})})-\log(P(Y|\theta^{(i)}))\\ &=\log(E_{P(Z|Y,\theta^{(i)})}[ \frac{P(Y|Z,\theta)P(Z|\theta)}{P(Z|Y,\theta^{(i)})}])-\log(P(Y|\theta^{(i)}))\\ &\geqslant E_{P(Z|Y,\theta^{(i)})}[\log(\frac{P(Y|Z,\theta)P(Z|\theta)}{P(Z|Y,\theta^{(i)})})]-E_{P(Z|Y,\theta^{(i)})}[\log(P(Y|\theta^{(i)}))]\\ &=E_{P(Z|Y,\theta^{(i)})}[\log(\frac{P(Y|Z,\theta)P(Z|\theta)}{P(Z|Y,\theta^{(i)})P(Y|\theta^{(i)})})] \end{aligned}$

最低0.47元/天解锁文章

惊了，还能这样？

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法》笔记——EM公式推导

文章目录EM算法问题描述算法导出GMM模型GMM模型描述使用EM算法估计GMMEM算法问题描述EM算法是一种利用数据估计生成模型的算法。即求解目标为数据满足的概率模型。假设观测变量为Y={y1,y2,…,yN}Y=\{y_1,y_2,\dots,y_N\}Y={y1,y2,…,yN}，隐藏变量为ZZZ，估计参数为θ\thetaθ。根据最大似然估计的思想，很自然的想法就是寻找合适的参...
复制链接

扫一扫