θ :文档-主题分布, θm是Dirichlet(α) , α 是Dirichlet分布的超参数,K维向量(K是主题数)
ϕ :主题-词分布, ϕz是Dirichlet(β) , β 是Dirichlet分布的超参数,V维向量(V是词典大小)
Z:词的主题, zmn是Mult
LDA笔记
最新推荐文章于 2020-12-19 13:53:34 发布
这篇笔记详细介绍了LDA模型,包括文档-主题分布θ和主题-词分布ϕ的Dirichlet先验,以及主题分配Z和词W的多项分布。重点讨论了collapsed Gibbs采样方法优化主题分配,并通过实例展示了多项分布的性质。此外,解释了超参数α和β对主题和词分布的影响。
摘要由CSDN通过智能技术生成