![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文本分类
疯颠颠_
优秀是一种态度。
展开
-
特征选择方法之信息增益
前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用特征与类别间的关联性来进行这个量化,关联性越强,特征得分越高,该特征越应该被保留。在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带转载 2014-03-11 23:35:07 · 629 阅读 · 0 评论 -
文本关键词的提取算法实验
转载自:http://blog.csdn.net/samule704/article/details/5118425 近期刚刚开始进入 SE 的领域,觉得这里面确实有很多值得研究的东西,从 网络爬虫 到 网页信息的抽取 再到 文本关键词的提取 以及用户检索(个性化SE) 等等 包罗万象。 下午玩完,先来无事,再次浏览了一下 蛙蛙池塘 的博客,觉得里面的对关键词的提取算转载 2014-03-13 09:47:25 · 527 阅读 · 0 评论