文本主题模型之LDA(三) LDA求解之变分推断EM算法

最新推荐文章于 2022-04-15 20:58:01 发布

weixin_30471561

最新推荐文章于 2022-04-15 20:58:01 发布

阅读量426

点赞数

文章标签：人工智能大数据

原文链接：http://www.cnblogs.com/hx868/p/10063290.html

版权

　本文是LDA主题模型的第三篇，读这一篇之前建议先读文本主题模型之LDA(一) LDA基础，同时由于使用了EM算法，如果你对EM算法不熟悉，建议先熟悉EM算法的主要思想。LDA的变分推断EM算法求解，应用于Spark MLlib和Scikit-learn的LDA算法实现，因此值得好好理解。

1. 变分推断EM算法求解LDA的思路

　　　　首先，回顾LDA的模型图如下：

　　

　　　　变分推断EM算法希望通过“变分推断(Variational Inference)”和EM算法来得到LDA模型的文档主题分布和主题词分布。首先来看EM算法在这里的使用，我们的模型里面有隐藏变量θ,β,z

　　　　问题是在EM算法的E步，由于θ,β,z

　　　　当进行若干轮的E步和M步的迭代更新之后，我们可以得到合适的近似隐藏变量分布θ,β,z

　　　　可见要完全理解LDA的变分推断EM算法，需要搞清楚它在E步变分推断的过程和推断完毕后EM算法的过程。

2. LDA的变分推断思路

　　　　要使用EM算法，我们需要求出隐藏变量的条件概率分布如下：

p (θ, β, z | w, α, η) = p ( θ , β , z , w | α , η ) p ( w | α , η )

　　　　前面讲到由于θ,β,z

　　　　我们假设隐藏变量θ

q (β, z, θ | λ, ϕ, γ) = \prod k = 1 K q (β k | λ k) \prod

　　　　我们的目标是用q(β,z,θ|λ,ϕ,γ)

(λ *, ϕ *, γ *) = a r g

　　　　其中D(q||p)

D (q | | p) = \sum x q (x) l o g q ( x ) p ( x ) = E q ( x ) ( l

　　　　我们的目的就是找到合适的λ∗,ϕ∗,γ∗

　　　　这个合适的λ∗,ϕ∗,γ∗

l o g (w | α, η) = l o g \int \int \sum z p (θ, β, z, w |

转载于:https://www.cnblogs.com/hx868/p/10063290.html

weixin_30471561

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
文本主题模型之LDA(三) LDA求解之变分推断EM算法

　本文是LDA主题模型的第三篇，读这一篇之前建议先读文本主题模型之LDA(一) LDA基础，同时由于使用了EM算法，如果你对EM算法不熟悉，建议先熟悉EM算法的主要思想。LDA的变分推断EM算法求解，应用于Spark MLlib和Scikit-learn的LDA算法实现，因此值得好好理解。1.变分推断EM算法求解LDA的思路　　　　首先，回顾LDA的模型图如下：　　　　...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。