LDA主题模型
迦南村夫
由于刚涉该领域站内的博文大多是转载关注的朋友的主要是自己查找方便大多未经作者同意在此感谢原作者同时也表示歉意.
展开
-
Introduction to Probabilistic Topic Models
此文为David M. Blei所写的《Introduction to Probabilistic Topic Models》的译文,供大家参考。摘要:概率主题模型是一系列旨在发现隐藏在大规模文档中的主题结构的算法。本文首先回顾了这一领域的主要思想,接着调研了当前的研究水平,最后展望某些有所希望的方向。从最简单的主题模型——潜在狄立克雷分配(Latent Dirichlet Allocation,...转载 2018-06-10 15:32:39 · 315 阅读 · 0 评论 -
LDA主题模型浅析
上个月参加了在北京举办SIGKDD国际会议,在个性化推荐、社交网络、广告预测等各个领域的workshop上都提到LDA模型,感觉这个模型的应用挺广泛的,会后抽时间了解了一下LDA,做一下总结:(一)LDA作用 传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个...转载 2018-06-10 16:55:36 · 5354 阅读 · 0 评论