情感分析总览
ABSA:译为基于方面的情感分析,本质就是对句子中不同对象可能会存在不同的情感倾向。
Effective LSTMs for Target-Dependent Sentiment Classification(COLING2016)
三种基于LSTM的模型:LSTM、Target-Dependent LSTM 、Target-Connection LSTM
Attention-based LSTM for Aspect-level Sentiment Classification(EMNLP2016)
提出了方面级信息的概念:target 和 aspect。
target 是包含在句子中出现的词
aspect 属于预先定义的类别刻画
基于以上,提出了两种模型:Attention-based LSTM (AT-LSTM)、Attention-based LSTM with Aspect Embedding (ATAE-LSTM)
缺点:
不是让注意力层专注于学习上下文词的相对重要性,而是给注意力层增加了对aspect和上下文词之间的关系进行建模的负担;
除了对顺序信息进行建模之外,LSTM的参数现在还承担了额外的负担,即,它还必须学习aspect和单词之间的关系。ATAE-LSTM中的LSTM层在一个由sapect embedding主导的序列上进行训练,这将大大增加模型的训练难度;
简单的拼接会使ATAE-LSTM中LSTM层的输入加倍,这会增加LSTM层 成本, 影响内存占用量,计算复杂性和存在过拟合风险。
Learning to Attend via Word-Aspect Associative Fusion for Aspect-based Sentiment Analysis(AAAI2018)
问题和解决:
target包含多个实体或单词时,现有的研究都是认为各部分重要性一致并且简单地计算平均值作为向量表示;
使用hierarchical attention建模得到的target和情感词之间的关联是一个黑箱;
未引入包含更多信息的外部知识
全局的attention会编码与任务不相关的信息
Targeted Aspect-Based Sentiment Analysis via Embedding Commonsense Knowledge into an Attentive LSTM(AAAI-18)
解决:
创建多层attention模型来分别明确计算目标词(target)和整个句子;
将外部知识引入传统LSTM网络;
将常识性情感知识融入深层神经网络。
「Commonsense Knowledge:SenticNet」
引入外部知识库SenticNet,含有50000个实例,每个实例对应一系列情感属性。情感属性提供了每个实例的表示,也将各个aspect与其情感链接起来。
输入门中情感概念的存在可以防止记忆细胞受到与已有知识冲突的输入标记的影响。同样,输出门使用这些知识过滤存储在记忆网络中的无关信息,调控模型是否使用情感知识。
#参考:
https://blog.csdn.net/hecongqing/article/details/105321410
https://blog.csdn.net/hecongqing/article/details/105321412
https://blog.csdn.net/hecongqing/article/details/105337395