《Aspect Sentiment Quad Prediction as Paraphrase Generation》论文阅读


文章地址: https://arxiv.org/abs/2110.00796

文章介绍

  这篇文章在已有的方面级情感分析任务的基础了研究了一项新的任务:方面级情感四元组提取(Aspect Sentiment Quad Prediction, ASQP)任务,旨在通过端到端的方式联合提取评论文本中所包含的方面实体、意见词、方面类别以及情感极性。为此,该篇论文作者提出了一种全新的模型范式PARAPHRASE(释义)生成,并不是直接将句子生成四元组的形似而是生成一个更符合人类生活习惯的自然语言形似从而可以更好地考虑到情感元素丰富的语义标签信息。

文章模型

问题定义

  对于一个输入的句子,ASQP旨在提取句子所包含的所有 {(c,a,o,p)}四元组。其中c代表方面类别(一般为数据集中预先说明或定义),a代表方面实体(可隐式或显示的出现在句子中,因此该项输出可为空),o代表意见词,p代表代表情感极性分为POS、NEU、NEG,有些任务会多一个invalid输出的形似。

文章模型

在这里插入图片描述
  作者所提出的模型如上图所示,其本质仍然为一个文本生成任务,但是与之前提取n元组任务处理不同的是,作者这里设置的是生成一个更贴近于自然语言的句子而不是直接生成孤单的情感元素。通过这样的处理,一方面可以更好地运用预训练语言模型的先验知识,而且生成一个真正意义上的句子也可以更好地使用文本中所含情感元素丰富的语义信息。

PARAPHRASE建模

  对于一个(c,a,o,p)四元组,作者的转化方式如下:
在这里插入图片描述
  其中P代表一个投影函数,即将原始的情感元素转变为自然语言的形似。如果一个句子中含有多个四元组的形似,作者采用[SSEP]特殊符号的形式隔开。
  对于意见词还有方面类别都可以直接使用原句或者预定义好的形式,但是情感极性直接用POS或者postive这样的在一些时候是不恰当的,因此作者这里也进行如下转化:
在这里插入图片描述
  由于方面实体可能不会显示的表达在语句中,因此作者这里也进行了相应的判断:
在这里插入图片描述
  一些例句如下所示:
在这里插入图片描述
  最后作者是采用了基于Transformer Encoder和Decoder架构的T5-base模型进行训练,encoder部分不用多说,decoder部分会有两个部分的输入一个是encoder部分的隐藏层的输出,另一个是t时刻之前decoder部分的输出。
在这里插入图片描述

  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值