统计学习方法第9章EM算法

最新推荐文章于 2020-06-05 11:26:33 发布

HYM-Enchanted

最新推荐文章于 2020-06-05 11:26:33 发布

阅读量149

点赞数

本文链接：https://blog.csdn.net/weixin_43758492/article/details/104748918

版权

EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计或极大后验概率估计。
EM算法每次迭代由两步组成：E步，求期望，M步，求极大。称为期望极大算法（expectation maximization）
观测数据为 $Y=(Y_,Y_2,\dots，Y_n)^T$ ，不可观测数据为 $Z=(Z_1,Z_2,\dots，Z_n)^T$ ,则观测数据的似然函数为 $P(Y|\theta)=\sum_zP(Z|\theta)P(Y|Z,\theta)$
$=\prod_{j=}^n[\pi p^{y_j}(1-p)^{1-y_i}+(1-\pi)q^{y_j}(1-q)^{1-y_j}]$
模型参数 $\theta=(\pi,p,q)$ 的极大似然估计为 $\hat\theta=argmax_\theta logP(Y|\theta)$
这个问题没有解析解，只有通过迭代的方法求解。

EM算法首先选取参数的初值，记做 $\theta^{(0)}=(\pi^{(0)},p^{(0)},q^{(0)})$ ,然后通过下面的步骤接待计算参数的估计值，直至收敛为止。第i次迭代参数的估计值为 $\theta^{(i)}=(\pi^{(i)},p^{(i)},q^{(i)})$ 。EM算法第i+1次迭代如下：
E步（求期望）：计算在模型参数 $\pi^{(i)},p^{(i)},q^{(i)}$ 下观测数据 $y_j$ 来自掷硬币B的概率
$\mu_j^{(i+1)}=\frac{\pi^{(i)}(p^{(i)})^{y_j}(1-p^{(i)})^{1-y_j}}{\pi^{(i)}(p^{(i)})^{y_j}(1-p^{(i)})^{1-y_j}+(1-\pi^{(i)})(q^{(i)})^{y_j}(1-q^{(i)})^{1-y_j}}$
M步（求极大化）：计算模型参数的新估计值
$\pi^{(i+1)}=\frac{1}{n}\sum_{j=1}^n\mu_j^{(i+1)}$
$p^{(i+1)}=\frac{\sum_{j=1}^n\mu_j^{(i+1)}y_j}{\sum_{j=1}^n\mu_j^{i+1)}}$
$q^{(i+1)}=\frac{\sum_{j=1}^n(1-\mu_j^{(i+1)})y_j}{\sum_{j=1}^n(1-\mu_j^{(i+1)})}$

EM算法

输入：观测变量数据Y，隐变量数据Z，联合分布 $P(Y,Z|\theta)$ ，条件分布 $P(Z|Y,\theta)$
输出：模型参数θ
（1）选择参数的初值 $\theta^{(0)}$ ,开始迭代
（2）E步：记 $\theta^{(i)}$ 为第i 次迭代参数θ的估计值，在第i+1次迭代的E步，计算
$Q(\theta,\theta^{(i)})=E_Z[logP(Y,Z|\theta)|Y,\theta^{(i)}]=\sum_zlogP(Y,Z|\theta)P(Z|Y,\theta^{(i)})$
这里 $P(Z|Y,\theta^{(i)})$ 是在给定观测数据Y和当前参数估计 $\theta^{(i)}$ 下隐变量数据Z的条件概率分布；
（3）M步：求使 $Q(\theta,\theta^{(i)})$ 极大化的 $\theta$ ，确定第i+1次迭代的参数估计值 $\theta^{(i+1)}$ ， $\theta^{(i+1)}=argmax_\theta Q(\theta,\theta^{(i)})$
（4）重复第（2）（3）步直至收敛。迭代停止条件，一般是对较小的正整数 $\varepsilon_1,\varepsilon_2$ 满足 $||\theta^{(i+1)}-\theta^{(i)}<\varepsilon_1$ 或 $||Q(\theta^{(i+1)},\theta^{(i)})-Q(\theta^{(i)},\theta^{(i)})||<\varepsilon_2$ ，则停止迭代。

EM算法在高斯混合模型学习中的应用

高斯混合模型

定义：高斯混合模型具有如下形式的概率分布： $P(y|\theta)=\sum_{k=1}^K\alpha_k\psi(y|\theta_k)$ ,其中 $\alpha_k$ 是系数， $\alpha_k\geq0,\sum_{k=1}^K\alpha_k=1;\psi(y|\theta_k)$ 是高斯分布密度， $\theta_k=(\mu_k,\sigma_k^2)$ ,
$\psi(y|\theta_k)=\frac{1}{\sqrt{2\pi}\sigma_k}exp\bigg(-\frac{(y-\mu_k)^2}{2\sigma_k^2}\bigg)$ 称为第k个分模型。

算法：高斯混合模型参数估计的EM算法

输入：观测数据 $y_1,y_2,\dots,y_N$ ,高斯混合模型；
输出：高斯混合模型参数
（1）取参数的初始值开始迭代
（2）E步：依据当前模型参数，计算分模型k对观测数据 $y_j$ 的响应度
$\hat\gamma_{jk}=\frac{\alpha_k\psi(y_j|\theta_k)}{\sum_{k=1}^K\alpha_k\psi(y_j|\theta_k)},j=1,2,\dots,N;k=1,2,\dots,K$
（3）M步：计算新一轮迭代的模型参数
$\hat\mu_k=\frac{\sum_{j=1}^N\hat\gamma_{jk}y_j}{\sum_{j=1}^N\hat\gamma_{jk}},k=1,2,\dots,K$
$\hat\sigma_k^2=\frac{\sum_{j=1}^N\hat\gamma_{jk}(y_j-\mu_k)^2}{\sum_{j=1}^N\hat\gamma_{jk}},k=1,2,\dots,K$
$\hat\alpha_k=\frac{\sum_{j=1}^N\hat\gamma_{jk}}{N},k=1,2,\dots,K$
（4）重复第（2）（3）步直至收敛。

HYM-Enchanted

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法第9章EM算法

EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计或极大后验概率估计。EM算法每次迭代由两步组成：E步，求期望，M步，求极大。称为期望极大算法（expectation maximization）观测数据为Y=(Y,Y2,…，Yn)TY=(Y_,Y_2,\dots，Y_n)^TY=(Y,Y2,…，Yn)T，不可观测数据为Z=(Z1,Z2,…，Zn)TZ=(Z_1,Z_2,\...
复制链接

扫一扫