文本情感分析中特征的选取与权重计算

最新推荐文章于 2024-04-25 12:02:02 发布

annuoa

最新推荐文章于 2024-04-25 12:02:02 发布

阅读量4.9k

点赞数 3

分类专栏： libsvm 文章标签： libsvm 特征选取与权重计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/annuoa/article/details/8517657

版权

本文介绍了在文本情感分析中如何使用libsvm进行特征选取和权重计算。通过指纹识别的比喻解释了特征选择的重要性，强调特征选择通常是基于卡方检验或信息增益等方法。TFIDF用于计算特征权重，但其权重并不代表特征的重要性，而是反映特征之间的差异。文章指出，不应将TFIDF用于直接特征选择，尽管有些论文中会采用这种方式。

摘要由CSDN通过智能技术生成

今天首先得说，在01/16号 22:02分开始的估计libsvm最优参数的终于出结果了。。。（鼓掌！！！）

哈哈，上面做的都是小实验，就是用libsvm做情感分析的，关键是让他跑通了路线，接下了就是要开始更细的去做，使他如何提高准确率啥的。从头开始我的情感分析之旅。。。

加油！！！

就从已经分完词的时候开始吧。（分词是用的中科院的东西来做的）

=========================================================================

首先要声明：是从这位大牛那里看到的http://www.blogjava.net/zhenandaci/archive/2009/04/19/266388.html

在文本分类的过程中，特征（也可以简单的理解为“词”）从人类能够理解的形式转换为计算机能够理解的形式时，实际上经过了两步骤的量化——特征选择阶段的重要程度量化和将具体文本转化为向量时的特征权重量化。初次接触文本分类的人很容易混淆这两个步骤使用的方法和各自的目的，因而我经常听到读者有类似

最低0.47元/天解锁文章

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。