TSA任务介绍
目标情感分析任务(Targeted Sentiment Analysis, TSA)旨在提取目标实体并对其进行情感分类。因此可以理解为命名实体识别(NER)和情感分析(SA)两个任务的联合学习。例如,给出一句“ESPN调查显示迈克尔乔丹是最伟大的篮球运动员”,检测目标是ESPN和迈克尔乔丹,他们的情绪类别分别为中性和正面。最近的一些工作试图联合学习这两项任务,看成序列标注问题,其中B/I/O表示目标的边界,Positive/Neutral/Negative标签表示情感分类 (Klinger and Cimiano, 2013; Yang and Cardie, 2013)。随着词嵌入(word embedding)引入NLP领域,多种神经网络模型被用来处理序列标注问题,有人通过词嵌入来丰富特征并训练神经网络模型来解决TSA问题,这是当前较为流行的方法。但是在长距离依赖性和字符级特征角度来说,以上方法并没有充分考虑。因此下面介绍一个来自EMNLP 2018的方法---hierarchical multi-layer bidi- rectional gated recurrent units(HMBi-GRU)。
HMBi-GRU
这个方法考虑了word和character两个层面的embedding特征,来探索字符级特征和高级语义特征,从而建立二者之间的长距离依赖。除了特征之外,此方法充分利用了实体和情感之间的边界信息:目标的边界信息(B,I)标签和情感标签是一样的。例如上面的例子中,Michael Jordon的目标标签和情感标签是“B-Person,I-Person”和“B-Positive,I-Positive”,通过这种方式,模型可以在预测情绪