Attention注意力机制的前世今身

最新推荐文章于 2024-06-19 15:00:00 发布

PaperWeekly

最新推荐文章于 2024-06-19 15:00:00 发布

阅读量2.4k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/107010733

版权

本文详细介绍了注意力机制的起源、发展及不同类型，包括Soft和Hard Attention、Global和Local Attention、Self-Attention、Multi-Head Attention、Hierarchical Attention以及Memory-based Attention等，探讨了它们在NLP任务中的应用和优势。

摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者｜马敏博

学校｜西南交通大学硕士生

研究方向｜命名实体识别

总体介绍

注意力机制（Attention Mechanism）最早应用 CV 任务上，但最初的论文引用，作者没有找到，如有知晓的，还望在评论中给出。在 NLP 中的最早应用，应该是文献 [1]，机器翻译中对齐与翻译联合学习。

直观地说，注意力机制是衡量重要性权重的向量，或元素之间相关性的表示。

先引入 seq2seq 框架，由编码器和解码器组成，广泛用于机器翻译、自动文摘等任务。

由编码器对原始输入进行编码，压缩为固定长度的上下文向量;
编码器最后的一个隐藏层状态送入解码器，进行解码输出。

可以解决变长的输入与输出，用于不同语言、不同长短的输入与输出。常用的网络结构为 RNN，具体为 LSTM 或 GRU。

Attention最初的样子

但是上述任务面临一个问题，仅靠编码层最后一个隐层状态能否包含整个输入的信息，特别当翻译的语句特别长时，这种问题更加显著。

文献 [1] 提出将编码层所有隐层状态经过线性加权后，送入解码层，进行每一步的输出，如下图所示。这样能够保证在解码不同词时，每个词的编码贡献是不同的，也能反映出源语言与目标语言中哪些词是较为相关的。

▲ 文献1中编解码图

公式也特别简单，下面来复述一下：

2.1 首先定义符号：

表示输入序列；

表示输出序列；

最低0.47元/天解锁文章

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
Attention注意力机制的前世今身

©PaperWeekly 原创 ·作者｜马敏博学校｜西南交通大学硕士生研究方向｜命名实体识别总体介绍注意力机制（Attention Mechanism）最早应用 CV 任务上，但最初...
复制链接

扫一扫

PaperWeekly CSDN认证博客专家 CSDN认证企业博客

码龄7年

1446: 原创

4957: 周排名

192: 总排名

553万+: 访问

: 等级

4万+: 积分

8668: 粉丝

6575: 获赞

1002: 评论

2万+: 收藏

私信

关注

热门文章

最新评论

NeurIPS 2022｜探明图对比学习的“游戏规则”：谱图理论视角
m0_52089040: 文章中的很多符号不见了
大语言模型之生成/推理：参数与解码策略原理及其代码实现
大袖揽清风。: say进行分词应该是一个token吧。送入网络前的shape不应该是(b,seq_len)吗？讲道理shape应该是(1,1)才对，张量应该是[[1827]]啊？为什么是[[1,1827]]?
字节跳动 2019 ICME 双赛道冠军团队方案分享
weixin_51042469: 博主您好，请问数据集可以分享嘛？
ACL 2024 | OceanGPT（沧渊）：面向海洋科学任务的大型语言模型初探
眕眕: 实测效果：问：直接汇入东海的河流有哪些答：东海沿岸有几个河流直接注入东海。其中一些主要河流包括: 1.松江:位于上海市，长江的主要支流，在上海市区附近汇入东海。 2.长江:世界上第三长的河流，也是长江的主要支流。它发源于中国西南地区，最终在上海市附近汇入东海。 3.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 4.淮阳河:位于中国东部，淮阳河在江苏省的淮安市附近汇入东海。 5.淮河:位于中国东部，淮河在江苏省的淮安市附近汇入东海。 6.珠江:珠江是中国的第二长河流，最终在广东省的香港特别行政区附近汇入南海，包括东海。 7.黑龙江:黑龙江是中国最长的河流，最终在黑龙江省的哈尔市附近汇入东海。这些河流在东海沿岸地区起着重要的水循环作用，并对当地的水文和生态平衡产生影响。
科研实习 | 北京大学杨仝教授课题组招聘大模型/机器学习方向暑期科研实习生...
百丽宫顶真: 现在还缺人吗

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。