统计学习方法学习笔记：第九章.EM算法及其推广

最新推荐文章于 2023-08-23 18:32:41 发布

小滔滔ahh

最新推荐文章于 2023-08-23 18:32:41 发布

阅读量223

点赞数

分类专栏：统计学习

本文链接：https://blog.csdn.net/weixin_44692791/article/details/102681984

版权

统计学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

第九章：EM算法及其推广

EM算法及其收敛性：

EM算法就是 $\color{red}{含有隐变量的概率模型参数的极大似然估计法}$ 或极大后验概率估计法；因为这样的概率模型时是无法求得解析解的，只能通过迭代的方式计算出近似值，而EM算法就可以理解为这样的一种求解参数值的 $\color{red}{迭代算法}$ ， $\color{blue}{将极大化观测数据Y关于参数\theta的对数似然函数的问题转变为求解Q函数关于参数\theta的极值的问题}$

选择参数初值：

$\theta^{(0)},开始迭代，\color{red}{EM算法对初值是敏感的，对于不同的初值，最终得到的参数估计也会不同}$

E步：求解的Q函数是与对数最大似然函数等效的一个表达式，每次迭代求解Q函数（最大似然函数的下界关于 $\theta$ 的表达式即省略掉极大化过程中对于 $\theta$ 而言是常数的那些项后）的极值，就相当于增大最大似然函数

计算Q函数：完全数据(Y,Z)的对数似然函数关于给定观测数据Y和当前参数 $\theta^{(i)}$ 下对未观测数据Z的条件概率分布的期望

$\color{red}{Q(\theta,\theta^{(i)})=E_Z[logP(Y,Z|\theta)|Y,\theta^{(i)}]}=\sum_ZlogP(Y,Z|\theta)P(Z|Y,\theta^{(i)})$

$\theta^{(i)}$ 是第i次迭代参数 $\theta$ 的估计值；Y为观测数据，Z为未观测数据

M步：

求解使得Q函数最大的那个 $\theta$ ,更新为 $\theta^{(i+1)}=\theta$ ， $\color{red}{每一次迭代都会使似然函数L(\theta)=logP(Y|\theta)=log[\sum_ZP(Y|Z,\theta)P(Z|\theta)]增大或者达到局部极大.}$

重复EM，直至 $\theta$ 值收敛；（可以证明，EM算法中的 $\color{red}对数似然函数序列L(\theta^{(i)})和参数估计序列\theta^{(i)}是收敛的，但是\theta^{(i)}只能保证收敛到L(\theta^{(i)})的稳定点，而不一定是极大值点，所以初值的选择就很重要$

在高斯混合学习模型中的应用：

输入：观测数据 $y_i$ ,高斯混合模型： $P(y|\theta)=\displaystyle\sum_{k=1}^K\alpha_k\phi(y|\theta_k),\phi(y|\theta_k)为高斯分布概率密度函数$

输出：高斯混合模型参数
$\theta=(\alpha_1,\alpha_2,...\alpha_k;\theta_1,\theta_2,...\theta_k),其中\theta_k=(\mu_k,\sigma_k^2)，为高斯分布的参数$

初始化参数 $\theta$
E步：计算分模型 $k$ 对观测数据 $y_i$ 的响应度 $\color{red}{E(\gamma_{jk}|y,\theta)：当前模型参数下，第j个观测来自第k个分模型的概率大小}$

$\hat\gamma_{jk}=\frac{\alpha_k\phi(y_j|\theta_k)}{\displaystyle\sum_{k=1}^K\alpha_k\phi(y_j|\theta_k)},j=1,2,...,N;k=1,2,...,K$ 可知能够求得一个N*K的响应度矩阵；
M步：计算新一轮的迭代模型参数：

$\hat\mu_k=\frac{\displaystyle\sum_{j=1}^N\hat\gamma_{jk}y_j}{\displaystyle\sum_{j=1}^N\hat\gamma_{jk}},\hat\sigma_k^2=\frac{\displaystyle\sum_{j=1}^N\hat\gamma_{jk}(y_j-\mu_k)^2}{\displaystyle\sum_{j=1}^N\hat\gamma_{jk}},\hat\alpha_k=\frac{\displaystyle\sum_{j=1}^N\hat\gamma_{jk}}{N};k=1,2,...,K$
5. 重复2、3直至收敛