统计学习方法——EM算法及其推广（一）

最新推荐文章于 2020-11-19 09:28:47 发布

你的名字5686

最新推荐文章于 2020-11-19 09:28:47 发布

阅读量402

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/wk19951125/article/details/89238939

版权

EM算法及其推广（一）

EM算法（期望极大算法）是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计。主要包含两步：

概率模型有时既含有观测变量，又含有隐变量（潜在变量）。

输入：观测变量数据 $Y$ ，隐变量数据 $Z$ ，联合分布 $P\left( {Y,Z\left| \theta \right.} \right)$ ，条件分布 $P\left( {Z\left| {Y,\theta } \right.} \right)$
输出：模型参数 $\theta$
流程：
- 选择参数的初始化 $\theta_{\left(0\right)}$ ，开始迭代
- E步：记 $\theta_{\left(i\right)}$ 为第 $i$ 次迭代参数 $\theta$ 的估计值，在第 $i + 1$ 次迭代的E步，计算
  $Q\left( {\theta ,{\theta ^{\left( i \right)}}} \right) = {E_Z}\left[ {\log P\left( {Y,Z\left| \theta \right.} \right)\left| {Y,{\theta ^{\left( i \right)}}} \right.} \right] = \sum\limits_Z {\log P\left( {Y,Z\left| \theta \right.} \right)P\left( {Z\left| {Y,{\theta ^{\left( i \right)}}} \right.} \right)}$
  其中 $P\left( {Z\left| {Y,{\theta ^{\left( i \right)}}} \right.} \right)$ 是在给定观测数据 $Y$ 和当前的参数估计 $\theta_{\left(i\right)}$ 下隐变量数据 $Z$ 的条件概率分布。
- M步：求使 $Q\left( {\theta ,{\theta ^{\left( i \right)}}} \right)$ 最大化的 $\theta$ ，确定第 $i + 1$ 次迭代的参数的估计值 $\theta_{\left(i+1\right)}$
  $\theta_{\left(i+1\right)}=\arg \mathop {\max }\limits_\theta Q\left( {\theta ,{\theta ^{\left( i \right)}}} \right)$
- 重复上面两步直到收敛，一般是：
  $\left\| { {\theta ^{\left( {i + 1} \right)}} - {\theta ^{\left( i \right)}}} \right\| < {\varepsilon _1}$

关注