使用非监督学习技术分析情感(IEEE2013)

Analysis of sentiments using unsupervised learning techniques 使用非监督学习技术分析情感(IEEE2013)

文章提出了一个新的模型:组合情感话题模型(CST)来同时检测文本的情感和话题。这个模型基于Gibbs采样算法。当转移到其他域时,观点挖掘的监督方法经常不能产生好的性能。不同于监督方法,CST的非监督性质使它高度可移植到其他域。CST模型相比于存在的半监督方法性能更好。
参考文献指出3个机器学习技术如朴素贝叶斯、最大熵分类和支持向量机在情感分类和传统的基于话题的分类表现不佳。本文关注于基于提出的非监督CST模型,结合话题检测和话题情感分析,划分一般领域文档的积极和消极情感。

方法

CST模型是基于LDA(Latent Dirichlet Allocation model)的。参考文献指出MG-LDA(Multi-Grain Latent Dirichlet Allocation model)框架的局限是:它仅仅基于话题,没有考虑话题和观点的关联。基于CST产生一个文档中的词需要两步。首先,从多重话题中选择一个分布,然后从话题分布中随机选择一个话题产生该话题的一个词。CST模型有4层,情感标签与文档连接,其下,话题与情感标签连接,词与情感标签和话题连接。考虑包含文档集 d1 d2 d3 ,…, dD 的语料库。每个文档包含词 w1 w2 ,…, wmd ,每个词包含词汇集1,2,…,V。令 tp

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值