![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
LDA
文章平均质量分 78
tianbwin2995
这个作者很懒,什么都没留下…
展开
-
用gensim做LDA实践之文本分类
之前看LDA,一直没搞懂到底作用是什么,公式推导了一大堆,dirichlet分布求了一堆倒数,却没有真正理解精髓在哪里。最近手上遇到了一个文本分类的问题,采用普通的VSM模型的时候,运行的太慢,后来查找改进策略的时候,想起了LDA,因此把LDA重新拉回我的视线,也终于弄懂了到底是做什么的。LDA本质是一种降维为什么这么说,因为在我的文本分类问题中,文本共有290w个,根据词项得到的维度为90w个,这原创 2016-06-27 14:43:22 · 21941 阅读 · 14 评论 -
机器学习算法及其并行化讨论
http://www.thebigdata.cn/JiShuBoKe/13723.html弄懂算法的核心,才知道能否并行三、LDA和MapReduce——可扩展的基础是数据并行 因为MPI在可扩展性上的限制, 我们可以大致理解为什么Google的并行计算架构上没有实现经典的MPI。同时,我们自然的考虑Google里当时最有名的并行计算框架MapReduce。 MapReduce 的风格和MPI截转载 2016-06-28 11:02:22 · 6062 阅读 · 0 评论