![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
LDA
文章平均质量分 77
TENLIU2099
这个作者很懒,什么都没留下…
展开
-
LAD原理(1)知识储备之函数和分布
更多内容请访问我的个人博客www.tenliu.top简介LDA是一种主题模型,它基于这样的思想:人写文章可以理解成这样的过程,再写一篇文档之前,先有这篇文档的主题分布(文档-主题),每一个主题也有词分布(主题-词)知识储备我们先从一些基础概念讲起Gamma函数先看公式 Γ(x)=∫∞0tx−1e−tdt\Gamma(x)=\int_{0}^{\infty}t_{原创 2017-09-25 17:36:56 · 1167 阅读 · 0 评论 -
LDA原理(2)知识储备之贝叶斯派和概率派
更多内容请访问我的个人博客www.tenliu.top介绍贝叶斯派和概率派概率派认为要推断的参数是固定的值,虽然概率是未知的,但是一定是固定的值,同时样本是随机的,既然这样,他们的侧重点就是研究样本空间,比如我们不知道抛硬币正面朝上的概率,那概率派的思路就是做很多次的抛硬币的实验,试验次数越多,越能逼近概率。 贝叶斯派思考的角度不同,他们认为参数是随机变量,样本是固定的,所以他们的研究重原创 2017-09-25 17:45:45 · 697 阅读 · 0 评论 -
LDA原理(3)知识储备之PLSA
更多内容请访问我的个人博客www.tenliu.top在讲PLSA概率潜在语义模型(似乎比LSA更容易解释 啊)之前 我们先定义一些表示:D表示语料库M表示该语料库中有M篇文档V表示语料库中的词的个数(当然重复的词只算一次)N表示语料库中词的词频(重复的也算),那么V个词,每个词的- 词频记为nin_id就是语料库中的一篇文档,wiw_i表示文档中的第i个词注意这是“概率原创 2017-09-25 17:48:34 · 343 阅读 · 0 评论