《Nonautoregressive Encoder–Decoder Neural Framework for End-to-End Aspect-Based Sentiment Triplet》


文章地址: https://ieeexplore.ieee.org/abstract/document/9634849

文章介绍

  目前针对于ASTE任务的方面级情感分析任务的处理难以处理2个主要挑战,一个是意见词与方面实体间的重叠关系,另一个是长距离之间的依赖问题。因此这篇文章通过一个端到端的生成结构来处理此类问题。其将ASTE建模为一个无序的三元组预测任务,并满足具有指针网络的非自回归的解码范式。在此基础上提出了一种高阶聚合机制,从而对重叠的三元组进行充分的交互。第三,提出了一个全新的损失函数——二部匹配损失,以专门用于该文所提出的模型的训练。

现有局限

在这里插入图片描述
  如上图所示,在同一意见词下的不同的方面实体往往会具有相同的情感,但是具有不同意见词描述的方面实体则会具有不同的情感极性。

文章模型

带有指针网络的编码和译码框架

  在编码阶段,作者通过Glove或者每个单词的表示(当然用ELMO或者BERT会取得更好的结果),除此之外作者利用CNN对每个单词进行字符级别的卷积,从而获得字符级别的表示。由于Transformer encoder本身是没有位置编码的,因此作者在这里加入了单词的绝对位置用以增强,最终一个单词的表示如下
在这里插入图片描述
  接下来就是多个Transformer encoder的叠加(中间带有多头注意力机制),最终获得每个语句特征表示。
在这里插入图片描述  在解码阶段,由于作者采用的是非自回归的方式,因此会存在无法确定生成单词的长度,以及三元组的数量的情况。所以作者设置了肯定会略大于每个句子可能含有的三元组阈值D
  接下来就是对于这D个查询进行嵌入(包含位置嵌入)
在这里插入图片描述  然后通过多层的transformer encoder进行解码
在这里插入图片描述
  接下来通过4个独立的前馈神经网络分别获得方面实体和意见词的开始以及结束位置的表示。
在这里插入图片描述
  然后是通过指针计算他们相应的位置,公式如下
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
  通过指针构建其相应的表示:
在这里插入图片描述

高阶聚合

  如果不同的方面实体-意见词对有重叠,那么作者就把他们连成一条边,从而构建了一个无向图,输入到GCN中进行卷积操作,最后得到每个词对的情感。
在这里插入图片描述

训练部分

  由于作者采用的是非自回归的解码方式,所以作者预测出来的三元组也是无序的,而且由于作者是设置了三元组阈值D,也就是对每一个语句预测出来的三元组数量很有可能也是多于原句的。因此作者这里是提出了一个新的损失计算方式,二部匹配损失(bipartite matching loss)。
  一共分为了2个步骤,首先是匹配,这里就是计算一个概率的最大值
在这里插入图片描述
在这里插入图片描述
  第二步就是计算损失,公式如下:
在这里插入图片描述
  示例图如下所示:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值