今天首先得说,在01/16号 22:02分开始的估计libsvm最优参数的终于出结果了。。。(鼓掌!!!)
哈哈,上面做的都是小实验,就是用libsvm做情感分析的,关键是让他跑通了路线,接下了就是要开始更细的去做,使他如何提高准确率啥的。从头开始我的情感分析之旅。。。
加油!!!
就从已经分完词的时候开始吧。(分词是用 的中科院的东西来做的)
=========================================================================
首先要声明:是从这位大牛那里看到的http://www.blogjava.net/zhenandaci/archive/2009/04/19/266388.html
在文本分类的过程中,特征(也可以简单的理解为“词”)从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化——特征选择阶段的重要程度量化和将具体文本转化为向量时的特征权重量化。初次接触文本分类的人很容易混淆这两个步骤使用的方法和各自的目的,因而我经常听到读者有类似