topicModel
ziyue246
简单,安静
展开
-
LDA主题模型笔记
LDA图模型每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。如下图: K为主题个数,M为文档总数,是第m个文档的单词总数。是每个Topic下词的多项分布的Dirichlet先验参数,是每个文档下Topic的多项分布的Dirichlet先验...原创 2018-07-16 10:17:12 · 1352 阅读 · 0 评论 -
pLSA图模型笔记
pLSA图模型求解目标p(W,D) ,整个文档集合的出现概率,使得p(W,D) 最大化,即为plsa的目标:下面咱们开始求解p(W,D):为 词wj在文档di中出现的次数;注释:为第m篇文档中,第n个词出现的概率,为第i篇文档中词表中第i个词出现的概率,由于di利用EM算法求至此,我们就可以用em算法迭代求解了其中、需要用偏导数=0...原创 2018-09-13 15:29:04 · 229 阅读 · 0 评论