机器学习3. EM算法与变分推断(Variational Inference)

最新推荐文章于 2024-07-19 10:51:16 发布

xd_ljq

最新推荐文章于 2024-07-19 10:51:16 发布

阅读量4.3k

点赞数 6

文章标签： EM 变分推断

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38333786/article/details/89296573

版权

参考文献

PRML

EM算法

核心思想（以混合高斯为例）：样本 $x$ 是由多个混合高斯组成，若我们知道每个数据 $x_i$ 来自于哪个混合高斯（如第 $k$ 个），那么我们对所有属于类 $k$ 的 $x_{ik}$ 使用极大似然估计就可以求得相应的参数。但是现在我们不知道样本 $x_{ik}$ 中到底属于哪个 $k$ ，我们可以先根据当前的参数 $\theta$ 估计一个样本的类别向量 $z_{ik}$ （E步），使得在这个类别向量下我的总似然最大，然后我在这个类别向量的条件下用以前的极大似然方法估计我新的参数（M步）。重复迭代直至收敛。

Jession 不等式
- 对凸函数 $f (x)$ 来说，有下式成立（凹函数反向）
  $\geq f(E[x])$
- 等号成立条件：
  $x$ 是常数
原始问题似然函数推导：
$l(\theta)=\sum_i log(P(x_i;\theta))$ 对数似然定义
$=\sum_i log(\sum_{z_i} P(x_i,z_i;\theta))$ 将隐变量展开
$=\sum_{i}log(\sum_{z_i}Q(z_i)\frac{P(x_i,z_i,\theta)}{Q(z_i)})$ ，其中 ${Q(z_i)}$ 是 $z_i$ 的分布（类似一个multinational的分布）
- 若直接对上式进行极大似然估计，那么由于对数内侧求和符号的存在，所求偏导比较复杂。
- 观察对数项，其实是 $\frac{P(x_i,z_i,\theta)}{Q(z_i)}$ 对 $Q$ 分布的一个数学期望，又因为对数函数是凹函数，由jession不等式可得下界：
  $\sum_{i}log(\sum_{z_i}Q(z_i)\frac{P(x_i,z_i,\theta)}{Q(z_i)}) =\sum_{i}log(E_Q[\frac{P(x_i,z_i,\theta)}{Q(z_i)}])$
  $\geq \sum_{i}E_Q[log(\frac{P(x_i,z_i,\theta)}{Q(z_i)})]$ (Jession 不等式)
  $=\sum_i\sum_{z_i}Q(z_i)log(\frac{P(x_i,z_i,\theta))}{Q(z_i)})$

最低0.47元/天解锁文章

关注

6
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。