Paper review [Exploiting Social Relations for Sentiment Analysis in Microblogging 2011]

Exploiting Social Relations for Sentiment Analysis in Microblogging

将社会管理融入微博情感分类中,与以往构建复杂特征对短文本和有噪声文本进行情感分析不同,将社会学中的“情感持续性(sentiment consistency)”和“情感感染性(sentiment contagion)”运用相应数学优化模型融入到监督学习中;

引言部分,列举了微博文本的一些特性,如:文本表达形式的非正式性;又列举了微博以外的附加信息,如除信息特征矩阵(message-feature matrix)外还有user-message matrix、user-user matrix;

论文主要贡献:1、在微博情感分析中使用社交关系并建立模型;2、通过社会关系建立两条信息之间的情感关系;3、提出一种新的能含噪音短文本的监督学习方法;4、在真实数据上实验验证;

相关文献研究:Alec用机器学习算法(distant supervision)对twitter信息进行情感分类;Barbosa通过语言特征,如书写特征及词语的源信息(meta-information)进行情感分类;还有些应用社会网络的情感分类方法,但本文是document-level的情感分类,处理的文本更加细粒度化(finer granularity);

实验使用的数据集:Standford twitter sentiment(STS)和Obama-McCain Debate(OMD) ;由于没有社交关系特征,使用的是Kwak通过爬虫爬取的twitter关系(2009),并对没有twitter关系或twitter量少于2条记录的进行过滤;

通过假设检验验证“情感一致性”是否在微博中存在;

文中指出不同的特征构造方法:如N-grams、Part of Speech、adjectives、sentiment vocabulary,但unigram模型作为特征效果最好;

利用最小二乘法考量模型和信息的匹配程度;

令user-message矩阵为U,user-user矩阵为F,sentiment consistency=U'U;emotion contagion = U'FU,最终都转换成message-message矩阵;

利用公式:A = sc + ethta*ec将sentiment consistency(两条信息是同一个用户发的,所以post中带的情感具有持续性)和emotion contagion(两条信息发送者是朋友或相互关注,所以post中带的情感具有感染性)联络到一起;

论文提出了算法模型,并对模型加入惩罚项进行优化;

论文结尾提出了一些后期研究方向:例如,1、除情感持续性和情感感染性外,考虑其他不同的情感关系实现情感分类;2、考虑瞬时空间模型,对情感持续性的影响,文中举了一个例子(people in Miami might be happier about the temperature than people in Chicago during winter time)3、考虑情感因素受内部因素(朋友)和外部影响(公共事件)的影响;




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值