评估文本评论情感分析的机器学习和非监督语义倾向性方法(IEEE2012)

该文评估了机器学习(如朴素贝叶斯、支持向量机)与非监督的语义倾向性方法(如SO-PMI-IR、SO-LSA)在文本评论情感分析中的性能。实验表明,非监督方法在大数据集上与机器学习方法表现相当,而在小数据集上SO-LSA更优。
摘要由CSDN通过智能技术生成

Evaluating Machine Learning and Unsupervised Semantic Orientation Approaches for Sentiment Analysis of Textual Reviews 评估文本评论情感分析的机器学习和非监督语义倾向性方法(IEEE2012)

文章中情感分析问题可以形式上定义为:给定一个文档集D,情感分类算法划分文档集中的每一个文档为两类,积极和消极。有时也使用中立类,表示那些文档不表达任何主观情感。

基于机器学习的分类器
  • 朴素贝叶斯算法
    可以看成两类文本分类问题。
    计算文档d在类c中的概率: P(c|d)=P(c)1kndP(tk|c) (1) P(tk|c) 是词项 tk 出现在类c中的一个文档的条件概率。 P(c) 是文档出现在类c的先验概率。被选择的词项通常叫做特征。为了进行话题分类,使用例如词项频率大于一定值的特征。为了划分文档,抽取带有特定标签的词项,例如形容词或形容词+副词的组合可能是一个好的选择。
    文档的类别归属通过(2)式计算: cmap=argmaxcCP^(c|d)=argmaxcCP
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值