文本情感分析中特征的选取与权重计算

本文介绍了在文本情感分析中如何使用libsvm进行特征选取和权重计算。通过指纹识别的比喻解释了特征选择的重要性,强调特征选择通常是基于卡方检验或信息增益等方法。TFIDF用于计算特征权重,但其权重并不代表特征的重要性,而是反映特征之间的差异。文章指出,不应将TFIDF用于直接特征选择,尽管有些论文中会采用这种方式。
摘要由CSDN通过智能技术生成

今天首先得说,在01/16号 22:02分开始的估计libsvm最优参数的终于出结果了。。。(鼓掌!!!)

哈哈,上面做的都是小实验,就是用libsvm做情感分析的,关键是让他跑通了路线,接下了就是要开始更细的去做,使他如何提高准确率啥的。从头开始我的情感分析之旅。。。

加油!!!

就从已经分完词的时候开始吧。(分词是用 的中科院的东西来做的)

=========================================================================

首先要声明:是从这位大牛那里看到的http://www.blogjava.net/zhenandaci/archive/2009/04/19/266388.html


在文本分类的过程中,特征(也可以简单的理解为“词”)从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化——特征选择阶段的重要程度量化和将具体文本转化为向量时的特征权重量化。初次接触文本分类的人很容易混淆这两个步骤使用的方法和各自的目的,因而我经常听到读者有类似
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值