LDA Gibbs Sampling公式推导

最新推荐文章于 2021-03-08 10:50:00 发布

lscHacker

最新推荐文章于 2021-03-08 10:50:00 发布

阅读量1.5k

点赞数 1

分类专栏： Machine Learning - Stat 文章标签： LDA 机器学习主题模型吉布斯抽样

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/miss_snow_m/article/details/60459166

版权

本文详细介绍了LDA模型中Gibbs Sampling的推导过程，包括联合分布、条件分布和后验概率的计算。通过推导得出p(zi=k|z-i,w)的公式，并解释了如何利用Dirichlet分布的期望来估计Multinomial分布的参数。文章还提到了Gibbs Sampling在处理大型文本数据集时的作用。" 104623266,9344292,SpringMVC模拟实现与转发重定向详解,"['Java', 'Spring', 'Web开发', 'MVC框架', 'Servlet']

摘要由CSDN通过智能技术生成

Gibbs Sampling

Background

所有的推导可以说都是根据这张图片：

$\alpha \in \mathbb{R}^{M \times K}$

$\theta_m \in \mathbb{R}^K$

$\beta \in \mathbb{R}^{K \times V}$

$\phi_k \in \mathbb{R}^{V}$

LDA的目的就是为了在给定 $\alpha, \beta$ 的情况下，求出 $\theta$ 和 $\phi$ 。

推导1 — 联合分布

求解 $p(s,z|\alpha, \beta) = p(w|z,\beta) \cdot p(z|\alpha)$

两个部分 $p(w|z,\beta)$ , $p(z|\alpha)$ 分别考虑。

对于第一部分： $p(w|z,\beta) = \int p(x|z,\phi) \cdot p(\phi|\beta) d \phi$

$p(x|z,\phi) = \sum_{k=1}^K p(w|z_k,\phi_k) = \sum_{k=1}^K \prod_{v=1}^{V} p(w|z_k, \phi_{k,v}) = \phi_{k,v}^{n_k^t}$ ，其中 ${n_k^t}$ 表示的是所有文档中属于topic k的词v的个数。
$p(\phi_k|\beta) = Dir(\phi_k|\beta) = \frac{1}{B(\beta)} \prod_{v=1}^V \phi_{k,v}^{\beta_v-1}$

所以 p(w|z,β)=∫∏Kk=1∏Vv=1ϕnvk,v⋅∏Kk=11B(β)∏Vv=1ϕβv−1k,vdϕk,v=∏Kk=11B(β)∫∏Vv=1ϕnvk+βk−1k

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。