自然语言理解
文章平均质量分 84
kobe00712
这个作者很懒,什么都没留下…
展开
-
Mallet之源文件结构
原文地址:Mallet之源文件结构作者:hzbachMallet源文件中重要的子目录:classify:监督式的分类算法types:重要的数据结构类型,像Instance实例,FeatureVector特征向量pipe:特征选择,变换实例每个分类方法用两个类实现:trainer和classifiertrainer把训练数据做为输入,创建classifier做为输出。每一个traine转载 2014-10-28 11:23:56 · 534 阅读 · 1 评论 -
java实现 tfidf
转载我的javaeye久链接: http://kobe00712.iteye.com/blog/1088455tfidf 做自然语言理解的经常用。文档的作为权重计算,许多初学者搞不清楚,权重计算特征选择。针对文本分类而言 作为很简单的说明,特征选择都跟 类别有关比如 卡方 信息增益而权重计算则与类别无关 比如 tfidf,tf具体公式请参看 http://zh.wikipedia.org原创 2014-10-28 11:23:48 · 408 阅读 · 0 评论