全部笔记的汇总贴:统计学习方法读书笔记汇总贴
潜在狄利克雷分配(Latent Dirichlet allocation, LDA),作为基于贝叶斯学习的话题模型,是潜在语义分析、概率潜在语义分析的扩展。
LDA模型是文本集合的生成概率模型。
一、迪利克雷分布
二、潜在迪利克雷分配模型
潜在狄利克雷分配(LDA) 是文本集合的生成概率模型。模型假设话题由单词的多项分布表示,文本由话题的多项分布表示,单词分布和话题分布的先验分布都是狄 利克雷分布。文本内容的不同是由于它们的话题分布不同。(严格意义上说,这里的多项分布都是类别分布,在机器学习与自然语言处理中,有时对两者不作严格区分。)