数据挖掘概念
文章平均质量分 81
Dr_Hm
数据挖掘
展开
-
主题模型是什么、工作原理【基础概念】※※※※※
转自:http://blog.sina.com.cn/s/blog_9d7bca9f01015580.html 摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在转载 2013-01-27 11:35:00 · 766 阅读 · 0 评论 -
LDA 【介绍】※※※
转自http://blog.csdn.net/huagong_adu/article/details/7937616 主题模型有两种:pLSA(ProbabilisticLatent Semantic Analysis)和LDA(Latent Dirichlet Allocation),下面主要介绍LDA。 (二)LDA介绍 如何生成M份包含N个单词的文档,转载 2013-01-27 17:20:42 · 582 阅读 · 0 评论 -
decison tree
__author__ = 'HM' from treelib import * class innerNode(Node): def __init__(self,attribute,parent_node_assert,identifier=None, expanded=True): self.parent_node_assert = parent_node_assert原创 2013-11-29 21:08:34 · 755 阅读 · 0 评论