PLSA+EM

最新推荐文章于 2021-10-23 22:04:20 发布

Little_sky_jty

最新推荐文章于 2021-10-23 22:04:20 发布

阅读量140

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/weixin_40805392/article/details/105360896

版权

笔记专栏收录该内容

13 篇文章 4 订阅

订阅专栏

加入隐变量的联合概率，条件概率等为：
$p\left(d_{i}, z_{k}, w_{j}\right)=p\left(d_{i}\right) p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)$
$\begin{array}{c} P\left(w_{j} | d_{i}\right)=\sum_{k=1}^{K} P\left(z_{k} | d_{i}\right) P\left(w_{j} | z_{k}\right) \\ P\left(d_{i}, w_{j}\right)=P\left(d_{i}\right) \sum_{k=1}^{K} P\left(w_{j} | z_{k}\right) P\left(z_{k} | d_{i}\right) \end{array}$
得到对数似然函数：
$L=\sum_{i=1}^{N} \sum_{j=1}^{M}\left[n\left(d_{i}, w_{j}\right) \log P\left(d_{i}\right)+n\left(d_{i}, w_{j}\right) \log \sum_{k=1}^{K} P\left(w_{j} | z_{k}\right) P\left(z_{k} | d_{i}\right)\right]$
求E-step,即是求解后验概率，根据步骤一的已知可以得到：
$\gamma\left(z_{i j k}\right)=p\left(z_{k} | d_{i}, w_{j}\right)=\frac{p\left(d_{i}\right) p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)}{\sum_{k=1}^{K} p\left(d_{i}\right) p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)}$
和 $p(d_i)$ 参数无关，消去得到：
$\gamma\left(z_{i j k}\right)=\frac{p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)}{\sum_{k=1}^{K} p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)}$
M-step
（1）求Q函数，对于一对样本而言，有期望函数为：
$\begin{array}{l} \sum_{k=1}^{K} \gamma\left(z_{i j k}\right) \log p\left(d_{i}, z_{k}, w_{j}\right) =\sum_{k=1}^{K} \gamma\left(z_{i j k}\right)\left(\log p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)+\log p\left(d_{i}\right)\right) \end{array}$
由于和单个样本的 $logP(d_i)$ 为常数，可以不考虑在优化中，简化为：
$\begin{array}{l} \sum_{k=1}^{K} \gamma\left(z_{i j k}\right)\left(\log p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)\right) \end{array}$
（2）对全部样本有：

$Q=\sum_{i=1}^{N} \sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \sum_{k=1}^{K} \gamma\left(z_{i j k}\right)\left(\log p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)\right)$

（3）最大化Q函数，结合约束项 $\sum_{k=1}^{K} p\left(z_{k} | d\right)=1$ 和约束项 $\sum_{w \in V} p\left(w | z_{k}\right)=1$ 分别可求到如下：

1）对于 $p\left(z_{k} | d_{i}\right)$ ，根据拉格朗日乘子法：
$Lg=Q\left(\theta, \theta^{o l d}\right)+\lambda\left(\sum_{k=1}^{K} p\left(z_{k} | d_{i}\right)-1\right)$
2）对 $p\left(z_{k} | d_{i}\right)$ 求偏导有，
$-\sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)=\lambda p\left(z_{k} | d_{i}\right)$
3）由于 $\sum_{k=1}^{K}\gamma\left(z_{i j k}\right)=1$ 和 $\sum_{k=1}^{K}p\left(z_{k} | d_{i}\right)=1$ ，带入上式有：

$\lambda=-\sum_{j=1}^{M} n\left(d_{i}, w_{j}\right)$
4）把 $\lambda$ 带入到上上式中，得到 $p\left(z_{k} | d_{i}\right)$ 的表达式：
$p\left(z_{k} | d_{i}\right)=\frac{\sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)}{\sum_{j=1}^{M} n\left(d_{i}, w_{j}\right)}$

同理，采用拉格朗日乘子法也可以求得 $p\left(w_{j} | z_{k}\right)$ 的表达，过程如下：
1）表达式：
$Lg=Q\left(\theta, \theta^{\text {old}}\right)+\lambda\left(\sum_{k=1}^{K} p\left(w_{j} | z_{k}\right)-1\right)$
2）求偏导得：
$-\sum_{i=1}^{N} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)=\lambda p\left(w_{j} | z_{k}\right)$
3）对参数 $j$ 的词累加得：
$\lambda=-\sum_{i=1}^{N} \sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)$
4）再带入(2)中，求得：
$p\left(w_{j} | z_{k}\right)=\frac{\sum_{i=1}^{N} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)}{\sum_{i=1}^{N} \sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)}$

总结得到优化的步骤为：
E-step，求后验概率：
$\gamma\left(z_{i j k}\right)=\frac{p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)}{\sum_{k=1}^{K} p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)}$
M-step:
$p\left(z_{k} | d_{i}\right)=\frac{\sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)}{\sum_{j=1}^{M} n\left(d_{i}, w_{j}\right)}$

$p\left(w_{j} | z_{k}\right)=\frac{\sum_{i=1}^{N} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)}{\sum_{i=1}^{N} \sum_{j=1}^{M} n\left(d_{i}, w_{j}\right) \gamma\left(z_{i j k}\right)}$

Little_sky_jty

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PLSA+EM

加入隐变量的联合概率，条件概率等为：p(di,zk,wj)=p(di)p(zk∣di)p(wj∣zk)p\left(d_{i}, z_{k}, w_{j}\right)=p\left(d_{i}\right) p\left(z_{k} | d_{i}\right) p\left(w_{j} | z_{k}\right)p(di,zk,wj)=p(di)p(zk∣di)p(wj∣...
复制链接

扫一扫