评估文本评论情感分析的机器学习和非监督语义倾向性方法（IEEE2012）

最新推荐文章于 2024-01-07 02:04:20 发布

gsp_2015

最新推荐文章于 2024-01-07 02:04:20 发布

阅读量3.7k

点赞数

分类专栏：论文阅读之倾向性分析文章标签： NB SVM SO-PMI-IR LSA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ABCD2010014357/article/details/48573885

版权

该文评估了机器学习（如朴素贝叶斯、支持向量机）与非监督的语义倾向性方法（如SO-PMI-IR、SO-LSA）在文本评论情感分析中的性能。实验表明，非监督方法在大数据集上与机器学习方法表现相当，而在小数据集上SO-LSA更优。

摘要由CSDN通过智能技术生成

Evaluating Machine Learning and Unsupervised Semantic Orientation Approaches for Sentiment Analysis of Textual Reviews 评估文本评论情感分析的机器学习和非监督语义倾向性方法（IEEE2012）

文章中情感分析问题可以形式上定义为：给定一个文档集D，情感分类算法划分文档集中的每一个文档为两类，积极和消极。有时也使用中立类，表示那些文档不表达任何主观情感。

基于机器学习的分类器

朴素贝叶斯算法
可以看成两类文本分类问题。
计算文档d在类c中的概率： $P(c|d)=P(c)\prod_{1≤k≤nd}P(t_k|c)\ (1)$ ， $P(t_k|c)$ 是词项 $t_k$ 出现在类c中的一个文档的条件概率。 $P(c)$ 是文档出现在类c的先验概率。被选择的词项通常叫做特征。为了进行话题分类，使用例如词项频率大于一定值的特征。为了划分文档，抽取带有特定标签的词项，例如形容词或形容词+副词的组合可能是一个好的选择。
文档的类别归属通过(2)式计算： cmap=argmaxc∈CP^(c|d)=argmaxc∈CP

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。