《Hierarchical Sequence Labeling Model for Aspect Sentiment Triplet Extraction》论文阅读


文章地址: https://link.springer.com/chapter/10.1007/978-3-030-60450-9_52

文章介绍

  在这篇文章中作者提出了一个继承性的序列标注模型( hierarchical sequence labeling model, HSLM)以端到端的方式识别文本语句中所含有的方面级情感三元组(ASTE)。该模型主要有三个部分组成:方面级序列标注模块、意见级序列标注模块、情感级序列标注模块。同时为了更好地学习到不同信息之间的交互,作者额外设计了三种信息融合机制主要包括方面特征融合机制,意见特征融合机制以及全局特征融合机制从而提取出更高级别的语义信息。

文章模型

编码层

  作者这里采用了glove获得原始单词的token表示,以及字符表示并将其拼接在一起,然后通过BiLSTM神经网络获得其上下文向量表示在这里插入图片描述

方面级序列标注模块

  作者首先通过{BA, IA, O}的标注方式获得语句中所可能含有的方面实体,具体通过softmax函数确认:
在这里插入图片描述

意见级序列标注模块

  获得语句中所包含的方面实体以后,为了能提取出对应方面实体的意见词,作者首先对方面实体的上下文向量表示做了一个平均处理从而避免统一方面实体的不同token出现情感不一致的现象。
在这里插入图片描述
  除此之外为了更好的利用预测结果,作者将平均池化表示m和方面标签嵌入拼接在一起,其中这个方面标签嵌入是随机初始化的这里我不太能理解,为啥随机初始化的会管用
在这里插入图片描述
  然后作者为每个方面实体构建其相应的意见词子序列。首先是将之前的方面实体和encoder部分的向量表示拼接在一起,然后子序列的计算如下
在这里插入图片描述
  然后再对于每一个子序列再通过softmax函数判断其实否为意见词
在这里插入图片描述

情感级序列标注模块

  当得到意见词序列标注以后,也是与方面实体一样应用了平均池化。由于对于每一个方面实体均对应的是一个子序列,而子序列当中有的词不为意见词,在池化操作中不需要将他们考虑在内,因此这里作者用了一个one-hot向量z来进行区分,而下文中的B代表子序列中意见词的数量。
在这里插入图片描述
  然后作者将得到方面实体表示和对应意见词表示拼接起来
在这里插入图片描述
  为了更好的捕捉到二者在原句中的交互信息,作者这里引用了注意力机制
在这里插入图片描述
  得到注意力机制的表示后,作者再将二者串联起来,最后通过一个softmax函数判断其相应的情感类别
在这里插入图片描述

情感级序列标注模块

  模型训练损失则为三者相加,系数为超参数。
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值