李航《统计学习方法》中只给出了三硬币模型的求解公式,但是没有给出推导过程。在我直接用EM算法公式求解时,由于Z包含了n次投币的隐变量,也即 Z = (z1, z2, z3 , ..., zn)。那么Q函数在对Z求和时,由于每次z可能取1或者0,因此一共有2^n项,需要化简后才能够求解。现有的博客均只给出了Q函数最终的化简结果,没给出化简的过程。因此写下这篇博客,方便其他人学习。
本文给出两种解法,第一种是重新推导一遍EM算法,第二种是使用公式求解。
下面先看第一种:
现在,再使用公式法直接求解,并将Q函数化简成同样的形式。化简过程的核心是分离出各次投币的结果。
有了Q函数后,就可以进行M步的计算了
参考文献:
[1] 《统计学习方法》-李航
[2] http://www.cnblogs.com/huangshansan/p/10588318.html
[3] http://blog.csdn.net/wendaomudong_l2d4/article/details/79005461