LDA Gibbs Sampling公式推导

本文详细介绍了LDA模型中Gibbs Sampling的推导过程,包括联合分布、条件分布和后验概率的计算。通过推导得出p(zi=k|z-i,w)的公式,并解释了如何利用Dirichlet分布的期望来估计Multinomial分布的参数。文章还提到了Gibbs Sampling在处理大型文本数据集时的作用。" 104623266,9344292,SpringMVC模拟实现与转发重定向详解,"['Java', 'Spring', 'Web开发', 'MVC框架', 'Servlet']
摘要由CSDN通过智能技术生成

Gibbs Sampling

Background

所有的推导可以说都是根据这张图片:

αRM×K

θmRK

βRK×V

ϕkRV

LDA的目的就是为了在给定 α,β 的情况下,求出 θ ϕ

推导1 — 联合分布

求解 p(s,z|α,β)=p(w|z,β)p(z|α)

两个部分 p(w|z,β) , p(z|α) 分别考虑。

对于第一部分: p(w|z,β)=p(x|z,ϕ)p(ϕ|β)dϕ

  • p(x|z,ϕ)=Kk=1p(w|zk,ϕk)=Kk=1Vv=1p(w|zk,ϕk,v)=ϕntkk,v ,其中 ntk 表示的是所有文档中属于topic k的词v的个数。
  • p(ϕk|β)=Dir(ϕk|β)=1B(β)Vv=1ϕβv1k,v

所以 p(w|z,β)=Kk=1Vv=1ϕnvk,vKk=11B(β)Vv=1ϕβv1k,vdϕk,v=Kk=11B(β)Vv=1ϕnvk+βk1k

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值