LDA(Lanton Dirichlet Allocation)浅显理解0.1

最新推荐文章于 2024-09-06 23:59:49 发布

coding如逆水行舟

最新推荐文章于 2024-09-06 23:59:49 发布

阅读量1.5k

点赞数

分类专栏：统计学文章标签：机器学习算法 LDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Earl211/article/details/50437198

版权

本文介绍了LDA（Latan Dirichlet Allocation）主题模型的基本思想，通过逐步解析Unigram Model、Mixture of Unigrams、pLSI到LDA的过程，阐述了LDA如何动态地处理主题和词汇的概率分布。同时，文章对比了pLSA与LDA的差异，并提及了相关知识点如gamma函数、Dirichlet分布和贝叶斯框架。

摘要由CSDN通过智能技术生成

这一段时间在看LDA主题模型，这里说一下我对LDA的理解，抛开复杂的数学、概率论、机器机器学习算法，只说思路，其他内容以后再更加详细的写。
假设有一个机器人，他想写一篇文章,每篇文章包含N个词，那么他怎么写呢？？？
这里写图片描述

1、Unigram model

科学家A一开始这么设计，先给机器人读大量的文章，这样这个机器人的大脑中会有S个词，这些词组成了词向量 $W=[w_1, w_2, w_3 ...... w_S]$ ，每一个词都有相对应的概率 $P=[p(w_1), p(w_2), p(w_3) ...... p(w_S)$ 。
算法如下：

for i = 1 to N:
　　choose a word $w_i～ p(W)$

数学表示即：

p(w)=∏p(wn) $p(w) = ∏ p(w n )$
这里写图片描述

这里写图片描述

2、Mixture of unigrams

科学家B觉得不应该这样，他认为机器人读的这些文章分成不同的主题 Z=[z1,z2....

最低0.47元/天解锁文章

coding如逆水行舟

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。