EM算法收敛性的推导
当第t次迭代开始时,将上一步的参数计算先验概率分布和条件概率分布以求出后验概率分布为 P(Z∣Y,θ(t)) ,带入下限函数B得
B(θ(t),θ)=∑zP(Z∣Y,θ(t))logP(X,Y∣θ)P(Z∣Y,θ(t))
似然函数L和下限函数B在
θ(t)
这一点相等,如下
B(θ(t),θ(t))−L(θ(t))====∑zP(Z∣Y,θ(t))logP(X,Y∣θ(t))P(Z∣Y,θ(t))−logP(Y∣θ(t))∑zP(Z∣Y,θ(t))logP(X,Y∣θ(t))P(Z∣Y,θ(t))−∑zP(Z∣Y,θ(t))logP(Y∣θ(t))∑zP(Z∣Y,θ(t))logP(X,Y∣θ(t))P(Z∣Y,θ(t))P(Y∣θ(t))∑zP(Z∣Y,θ(t))log1=0
由于对 B(θ(t),θ) 求极大值在 θ(t+1) 取得,因此
B(θ(t),θ(t))≤B(θ(t),θ(t+1))
又由B是L的下限函数,因此
B(θ(t),θ(t+1))≤L(θ(t+1))
综上,
L(θ(t+1))≥L(θ(t))
又似然函数一定小于1大于0,那么似然函数有界,函数单调又有界必收敛,似然函数的收敛性得证。