![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
主题模型算法
文章平均质量分 81
蜡笔大龙猫
这个作者很懒,什么都没留下…
展开
-
Topic Model的分类总结(LDA变种)
转自:http://hi.baidu.com/ouyanggaoyan/item/5b5c01d4c518871cd78ed0d7#713670-tsina-1-29064-128ff9f28d958dae738be418601ffbcdTopic models主要可以分为四大类:1.无监督无层次结构, 主要有: (1)PLSA(Hofmann转载 2013-07-29 08:33:10 · 10115 阅读 · 1 评论 -
Spark LDA
关于LDA的理论部分,参考其他博客(链接待定),本文主要记录spark中LDA的实现。spark1.4版本的LDA原文比较简单,下面主要是以翻译官网为主。理论部分LDA是一个主题模型,它能够推理出一个文本文档集合的主题。LDA可以认为是一个聚类算法,原因如下:主题对应聚类中心,文档对应数据集中的样本(数据行)主题和文档都在一个特征空间中,其特征向量是词频向量跟使用传统的距离来评估聚类不一样的是原创 2015-12-08 16:59:33 · 9737 阅读 · 0 评论 -
LDA理解以及源码分析(二)
LDA系列的讲解分多个博文给出,主要大纲如下:LDA相关的基础知识 什么是共轭multinomial分布Dirichlet分布LDA in text LAD的概率图模型LDA的参数推导伪代码GibbsLDA++-0.2源码分析Python实现GibbsLDA参考资料GibbsLDA++-0.2源码分析GibbsLDA++-0.2工具包下载地址为:下载工具包里docs文件夹里有原创 2015-12-09 17:31:13 · 6749 阅读 · 1 评论 -
LDA理解以及源码分析(一)
LDA系列的讲解分多个博文给出,主要大纲如下:LDA相关的基础知识 什么是共轭multinomial分布Dirichlet分布LDA in text LAD的概率图模型LDA的参数推导伪代码GibbsLDA++-0.2源码分析Python实现GibbsLDA参考资料LDA相关的基础知识LDA是Blei于2002年发表的概率语言模型,被广泛应用于主题建模中,通过对文本进行潜语义原创 2015-12-09 17:27:15 · 17211 阅读 · 1 评论