ABSA01:Attentional Encoder Network for Targeted Sentiment Classification

最新推荐文章于 2022-07-07 21:15:07 发布

暖小砚。

最新推荐文章于 2022-07-07 21:15:07 发布

阅读量1.6k

点赞数 3

文章标签：自然语言处理

本文链接：https://blog.csdn.net/weixin_44585469/article/details/103624575

版权

本文提出注意编码网络（AEN），解决RNN的并行化问题，通过注意机制增强目标词与上下文的关系建模。为解决标签不确定性，引入标签平滑正则化，并利用预训练BERT提升性能，实现在目标导向情感分类任务上的最新成果。

摘要由CSDN通过智能技术生成

ABSA01:Attentional Encoder Network for Targeted Sentiment Classification

摘要

摘要

RNN很难并行化，而经过时间截断的反向传播给记住长期模式带来了困难。本文提出了一种避免重复的注意编码网络（AEN），该网络采用基于注意的编码来建立上下文和目标之间的模型。提出了标签不可靠性问题，引入了标签平滑正则化。我们还将预训练的BERT应用到这项任务中，获得了最新的最新结果。实验和分析证明了该模型的有效性和轻量级。

1引言

近年来，神经网络模型被设计用于从目标和上下文中自动学习有用的低维表示，并获得有希望的结果。
注意机制的目的是加强对与目标语语义关系更密切的上下文词汇的注意。
这项工作的主要贡献如下：

我们设计了一个注意编码网络来绘制目标词和上下文词之间的隐藏状态和语义交互。
我们提出了标签不可靠性问题，并在损失函数中加入了一个有效的标签平滑正则化项，以鼓励模型对训练模糊标签缺乏信心。
我们将预训练的BERT应用到这项任务中，我们的模型提高了基本BERT模型的性能，并获得了最新的结果。
我们评估了比较模型的模型大小，并展示了所提出模型的轻量级。

2相关工作

TD-LSTM扩展LSTM，分别使用两个单向LSTM对目标词的左上下文和右上下文进行建模。（Tang：Effective lstms for target-dependent sentiment classification）
MemNet由一个具有外部存储器的多跳注意机制组成，用于捕获与给定目标相关的每个上下文单词的重要性。为了构建更高层次的语义信息，对嵌入词所代表的记忆进行了多重关注。（Tang：Aspect
level

最低0.47元/天解锁文章

暖小砚。

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
ABSA01:Attentional Encoder Network for Targeted Sentiment Classification

ABSA01:Attentional Encoder Network for Targeted Sentiment Classification摘要引言相关工作提出方法试验摘要RNN很难并行化，而经过时间截断的反向传播给记住长期模式带来了困难。本文提出了一种避免重复的注意编码网络（AEN），该网络采用基于注意的编码来建立上下文和目标之间的模型。提出了标签不可靠性问题，引入了标签平滑正则化。我们...
复制链接

扫一扫