Unsupervised Sentiment Analysis with Emotional Signals
提出通过情感符号配合无监督的学习方法达到情感分类的目的;文中提出两个概念:Emotion Indication和Emotion Correlation,Emotion Indication指那些能明显反应post和word情感类型的符号;Emotion Correlation指那些能联系post和word的情感符号;文章定义为无监督的学习,在文中发现是通过聚类得到Post和word的最近邻,再构造矩阵;
提出Post-word矩阵的概念,这个矩阵最后参与到情感计算里,并且还使用了矩阵因子分解的方法;
论文解决问题的思路主要是机器学习里的经验最大化的概念,论文的主要模型函数是:
其中是Post-level的Emotion Indication;有Post-level的,也有对应word-level的Emotion Indication:
与之对应,就提出Post-level和word-level的Emotion Correlation:和;
借鉴了ONMTF模型:
通过实验数据不断修正参数,实验的伪代码:
实验数据包括:Standford Twitter Sentiment和Obama-McCain Debate,STS数据通过调用Twitter API数据接口获得。