《统计学习》笔记（2）-- EM算法

最新推荐文章于 2022-10-08 23:43:54 发布

huangjx36

最新推荐文章于 2022-10-08 23:43:54 发布

阅读量716

点赞数

分类专栏：统计学习方法

统计学习方法专栏收录该内容

2 篇文章

订阅专栏

EM算法
（1）EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计。
（2）EM算法的每次迭代由两步组成：E步，求期望；M步，求极大。所以这一算法称为期望极大算法，简称EM算法。
（3）观测数据的极大似然估计没有解析解，只有通过迭代的方法求解，使用EM算法可以求解。
（4）EM算法与初值的选择有关，选择不同的初值可能得到不同的参数估计值。
（5）用 $Y$ 表示观测随机变量的数据，用 $Z$ 表示隐随机变量的数据。 $Y$ 和 $Z$ 连在一起称为完全数据，观测数据 Y <script type="math/tex" id="MathJax-Element-1516">Y</script>又称为不完全数据。
（6）EM算法通过迭代求观测数据的对数似然函数的极大似然估计。
（7）EM算法的收敛是迭代过后参数的值不再变化，或者变化在一个阀值以内。
（8）EM算法是通过不断求解下界的极大化逼近求解对数似然函数极大化的算法。
（9）关于EM算法收敛的两个定理：①观测数据的似然函数是递增的；②观测数据的对数似然函数只会收敛到函数的稳定值。
（10）定理只能保证参数估计序列收敛到对数似然函数序列的稳定点，不能保证收敛到极大值点。因此，初值的选择非常重要，常用的办法是选取几个不同的初值进行迭代，然后对得到的各个估计值加以比较，从中选择最好的。