主题模型-LDA[LatentDirichlet Allocation]
原文地址:http://blog.csdn.net/huagong_adu/article/details/7937616
分类: 数据挖掘 机器学习
(一)LDA作用
传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。
转载
2014-03-31 15:46:07 ·
702 阅读 ·
0 评论