理解主题模型LDA(这一篇就足够了)

潜在狄利克雷分布(Latent Dirichlet Allocation,简称LDA)是一种基于贝叶斯算法,利用先验分布对数据进行似然估计并最终得到后验分布的一种常用的主题模型。LDA在文本数据挖掘,图像处理,生物信息处理等领域被广泛使用。
LDA模型是文本集合的生成概率模型,假设每个文本由主题的一个多项分布表示,每个主题由单词的一个多项式分布表示,特别假设文本的主题分布的先验分布是狄利克雷分布,主题的单词分布的先验分布也是狄利克雷分布。先验分布的导入使LDA能够更好的应对主题模型学习中的过拟合现象。
本人在看了一些博客以及书籍后,发现了一篇大神介绍LDA的,深入浅出,极其全面,对于想要深入理解LDA的人来说真的是非常具有帮助的,读完后就算不是全部理解,那也会对LDA有一个比较深的认识了。
由于LDA涉及比较多的高等数学知识,对于数学一般的人来说,阅读下面这篇博客一定要沉下心来,沉下心来,沉下心来,然后你必定会对LDA有更深一层次的理解。
踏上深入理解LDA的道路吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值