Attention学习

最新推荐文章于 2022-07-14 19:24:05 发布

代码artist

最新推荐文章于 2022-07-14 19:24:05 发布

阅读量585

点赞数

分类专栏： NLP 文章标签：学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gs344937933/article/details/123152342

版权

NLP 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

浅谈Attention机制的理解通俗易懂，很适合入门。

Attention机制最早是应用于图像领域的，九几年就被提出来的思想。

相关论文：

《Recurrent Models of Visual Attention》，2014年，google提出。

算是最早将attention融合到深度学习中。在RNN模型上使用了attention机制来进行图像分类，然后取得了很好的性能。然后就开始一发不可收拾了。

《Neural Machine Translation by Jointly Learning to Align and Translate》，2015年，使用类似attention的机制在机器翻译任务上将翻译和对齐同时进行，他们的工作算是第一个将attention机制应用到NLP领域中。接着attention机制就被广泛应用在基于RNN/CNN等神经网络模型的各种NLP任务中去了，效果看样子是真的好。

《Attention is all you need》，2017年，google。

大量使用了自注意力（self-attention）机制来学习文本表示。这篇论文引起了超大的反应，本身这篇paper写的也很赞，很是让人大开眼界。

见：李沫的b站视频，讲的很详细：Transformer论文逐段精读【论文精读】

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Attention学习

浅谈Attention机制的理解通俗易懂，很适合入门。Attention机制最早是应用于图像领域的，九几年就被提出来的思想。相关论文：《Recurrent Models of Visual Attention》，2014年，google提出。算是最早将attention融合到深度学习中。在RNN模型上使用了attention机制来进行图像分类，然后取得了很好的性能。然后就开始一发不可收拾了。《Neural Machine Translation by Jointly ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。