ABSA01:Attentional Encoder Network for Targeted Sentiment Classification

本文提出注意编码网络(AEN),解决RNN的并行化问题,通过注意机制增强目标词与上下文的关系建模。为解决标签不确定性,引入标签平滑正则化,并利用预训练BERT提升性能,实现在目标导向情感分类任务上的最新成果。
摘要由CSDN通过智能技术生成

ABSA01:Attentional Encoder Network for Targeted Sentiment Classification

摘要

RNN很难并行化,而经过时间截断的反向传播给记住长期模式带来了困难。本文提出了一种避免重复的注意编码网络(AEN),该网络采用基于注意的编码来建立上下文和目标之间的模型。提出了标签不可靠性问题,引入了标签平滑正则化。我们还将预训练的BERT应用到这项任务中,获得了最新的最新结果。实验和分析证明了该模型的有效性和轻量级。

1引言

近年来,神经网络模型被设计用于从目标和上下文中自动学习有用的低维表示,并获得有希望的结果。
注意机制的目的是加强对与目标语语义关系更密切的上下文词汇的注意。
这项工作的主要贡献如下:

  1. 我们设计了一个注意编码网络来绘制目标词和上下文词之间的隐藏状态和语义交互。
  2. 我们提出了标签不可靠性问题,并在损失函数中加入了一个有效的标签平滑正则化项,以鼓励模型对训练模糊标签缺乏信心。
  3. 我们将预训练的BERT应用到这项任务中,我们的模型提高了基本BERT模型的性能,并获得了最新的结果。
  4. 我们评估了比较模型的模型大小,并展示了所提出模型的轻量级。

2相关工作

  1. TD-LSTM扩展LSTM,分别使用两个单向LSTM对目标词的左上下文和右上下文进行建模。(Tang:Effective lstms for target-dependent sentiment classification)
  2. MemNet由一个具有外部存储器的多跳注意机制组成,用于捕获与给定目标相关的每个上下文单词的重要性。为了构建更高层次的语义信息,对嵌入词所代表的记忆进行了多重关注。(Tang:Aspect
    level
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值