EM算法是一种迭代算法,每次迭代由两步组成:E步和M步,E步一般求响应度,M步一般求模型参数值。EM用于含有隐变量的概率模型参数的极大似然估计,常用于混合高斯模型、隐马尔科夫模型等的参数估计。
作为迭代算法,必须要考虑EM算法的收敛性。这里需要简要提及其推导,目标是极大化观测数据Y关于参数theta的极大似然函数。基于log函数是一个凹函数,基于Jensen不等式,我们找到对数似然函数的一个下界:Q函数。EM算法不断求解下界的极大化,从而逼近求解对数似然函数极大化。作为结论,EM算法不能保证找到全局最优值。为了促进收敛,选取更好的初值,放宽迭代结束的阈值是可以选择的策略。
掌握度: 7分