《A novel network with multiple attention mechanisms for aspect-level sentiment analysis》论文阅读

最新推荐文章于 2024-10-06 08:54:13 发布

jst100

最新推荐文章于 2024-10-06 08:54:13 发布

阅读量929

点赞数 22

文章标签：论文阅读

本文链接：https://blog.csdn.net/jst100/article/details/125791242

版权

文章地址：https://www.sciencedirect.com/science/article/pii/S0950705121004585

文章目录

文章内容

方面级情感分析旨在识别出给丁丁句子中特定词的情感极性，但现有的使用RNN神经网络的模型会存在反向传播截断、梯度消失等问题，因此作者设计了一种多种注意力机制的推断网络，通过BERT获得句子的嵌入表示，然后使用内层内和层间注意力机制来迫使模型更关注与aspect相关的部分。在层内注意力机制当中采用了类似于transformer的多头注意力机制和逐点前馈神经网络结构。在跨层注意力机制当中，采用全局注意力机制来捕获目标实体与方面实体之间的交互关系，

文章所用符号表示

在这里插入图片描述

模型表述

在这里插入图片描述
文章的模型图如上所示。

词嵌入

对于词嵌入作者就是采用的BERT-Base模型，方面实体和上下文分别做嵌入
在这里插入图片描述

层内交互机制

作者的层内交互机制由两部分组成，仿照Transformer，一共有2个部分，首先就是多头注意力机制，直接参考《Attention is all you need》即可，接下来就是逐点前馈神经网络（Point-wise feed-forward network，PWFF），其公式如下：
在这里插入图片描述
这里卷积核和步长均为1，因为作者只关注于单词级别的隐藏层表示，这里也是上下文和方面实体分开来做

特征聚焦注意力机制

作者一共设计了2种注意力机制，分别是上下文屏蔽机制（ masked mechanism of context，MMC）和上下文加权机制（ weighted down mechanism of context，WDMC）。
首先作者先计算了上下文中的单词与aspect方面实体的距离，公式如下：
在这里插入图片描述
然后作者提出了一个新的概念，保留窗口，如图中的蓝色所示，保留窗口的大小等于给定方面前后的总词数。

保留窗口中上下文词的隐藏嵌入值将被完全保留，而保留窗口外的词将被掩盖或加权，其中MMC和WDMC的算法流程如下所示：
在这里插入图片描述