EM算法

最新推荐文章于 2023-08-12 10:25:34 发布

麓山coder

最新推荐文章于 2023-08-12 10:25:34 发布

阅读量421

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/tercel_w/article/details/64921356

版权

机器学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

EM算法

首先举一个含有隐变量的例子

有三枚硬币A,B,C,首先抛A硬币，如果A正面朝上则抛B，如果A 反面朝上则抛C，我们只记录B,C硬币的结果。这个过程重复N次得到观测到的结果 $Y=\{y_1,y_2,…,y_N\}$ ,现在要求计算出A，B，C正面朝上的概率分别是多少。

我们设每次抛硬币过程中，A硬币的结果为Z。因为Z是无法观测到的，我们称它为隐变量。

记 $\theta$ ={P(A),P(B),P(C)},表示模型的参数，最大似然概率为

L (θ) = log p (Y | θ) = log \sum Z p (Y, Z | θ)

$L(\theta)=\log p(Y|\theta)=\log\sum_{Z}p(Y,Z|\theta)$
由于存在隐变量，无法直接采用最大似然估计算出硬币出现正面的概率。

假设第i步求出 $\theta^{(i)}$ ,那么下一步求出的 $\theta$ 要满足 $L(\theta) > L(\theta^{(i)})$ ,只有这样才有可能求出最优解

L (θ) - L (θ (i)) = log \sum Z p (Y, Z | θ) - log p (Y | θ (i)) = l o g \sum Z p ( Y , Z | θ ) p ( Y | θ ( i ) ) = l o g \sum Z p (Z | Y, θ (i)) p ( Y , Z | θ ) p ( Z | Y , θ ( i ) ) p ( Y | θ ( i ) ) \geq \sum Z p (Z | Y, θ (i)) log p ( Y , Z | θ ) p ( Z | Y , θ ( i ) ) p ( Y | θ ( i ) )

$\begin{eqnarray} L(\theta) - L(\theta^{(i)}) &&= \log \sum_{Z}p(Y,Z|\theta) - \log p(Y|\theta^{(i)}) \\ &&=log \sum_{Z} \frac{p(Y,Z|\theta)}{p(Y|\theta^{(i)})} \\ &&= log \sum_{Z}p(Z|Y,\theta^{(i)}) \frac{p(Y,Z|\theta)}{p(Z|Y,\theta^{(i)}){p(Y|\theta^{(i)})}} \\ && \geq \sum_{Z}p(Z|Y,\theta^{(i)}) \log \frac{p(Y,Z|\theta)}{p(Z|Y,\theta^{(i)}){p(Y|\theta^{(i)})}} \\ \end{eqnarray}$
上式的不等号可由琴森不等式得到，对于凸函数f(x)可以得到如下不等式

f (\sum i = 1 N λ i x i) \geq \sum i = 1 N λ i f (x i)

$f(\sum_{i=1}^N \lambda_i x_i) \geq \sum_{i=1}^N \lambda_i f(x_i)$
其中

∑Ni=1λi=1 $\sum_{i=1}^N \lambda_i =1$

所以

L (θ) \geq L (θ (i)) + \sum Z p (Z | Y, θ (i)) log p ( Y , Z | θ ) p ( Z | Y , θ ( i ) ) p ( Y | θ ( i ) )

$L(\theta) \geq L(\theta^{(i)}) +\sum_{Z}p(Z|Y,\theta^{(i)}) \log \frac{p(Y,Z|\theta)}{p(Z|Y,\theta^{(i)}){p(Y|\theta^{(i)})}}$
想要使

L(θ) $L(\theta)$ 最大，那么其下限必须要取最大，问题转化为最大化似然函数的下限。

θ = arg max θ (L (θ (i)) + \sum Z p (Z | Y, θ (i)) log p ( Y , Z | θ ) p ( Z | Y , θ ( i ) ) p ( Y | θ ( i ) )) = arg max θ \sum Z p (Z | Y, θ (i)) log p (Y, Z | θ)

$\begin{eqnarray} \theta &&= \arg \max_{\theta} (L(\theta^{(i)}) +\sum_{Z}p(Z|Y,\theta^{(i)}) \log \frac{p(Y,Z|\theta)}{p(Z|Y,\theta^{(i)}){p(Y|\theta^{(i)})}}) \\ && = \arg \max_{\theta} \sum_{Z}p(Z|Y,\theta^{(i)}) \log p(Y,Z|\theta) \end{eqnarray}$
记