文本分类
tlovet1314
这个作者很懒,什么都没留下…
展开
-
文本分类入门(番外篇)特征选择与特征权重计算的区别
转自:http://www.blogjava.net/zhenandaci/archive/2009/04/19/266388.html 在文本分类的过程中,特征(也可以简单的理解为“词”)从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化——特征选择阶段的重要程度量化和将具体文本转化为向量时的特征权重量化。初次接触文本分类的人很容易混淆这两个步骤使用的方转载 2010-03-17 14:14:00 · 431 阅读 · 0 评论 -
ICTCLAS2010分词工具
计算所汉语词法分析系统 ICTCLAS 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测原创 2010-04-15 21:45:00 · 1421 阅读 · 2 评论