注意力机制的原理

最新推荐文章于 2024-08-08 16:38:28 发布

果子果实

最新推荐文章于 2024-08-08 16:38:28 发布

阅读量464

点赞数

分类专栏：深度学习

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

https://blog.csdn.net/hpulfc/article/details/80449561
https://blog.csdn.net/hpulfc/article/details/80448570
https://blog.csdn.net/songbinxu/article/details/80739447

谷歌2017年发表的那篇《Attention is all you need》

Sequence to Sequence

Attention Mechanism的大量使用源于机器翻译，机器翻译本质上是解决一个Sequence-to-Sequence问题

Sequence to Sequence 的各种形式

在这里插入图片描述
Sequence-to-Sequence一般有5种形式，区别在于输入和输出序列的长度，以及是否同步产出，具体到每一个基本的模块，又能用不同的网络结构实现，包括CNN、RNN，它们的实现基本上离不开一个固定的结构：Encoder-Decoder结构。
Attention解决了它的“分心问题”
在这里插入图片描述
，一个简单的Encoder-Decoder，它的Encoder和Decoder都是RNN结构
attention model的要求：
1.对输入序列的不同局部，赋予不同的重要性（权重）
2.对于不同的输出序列局部，给输入局部不一样赋权规划或方案（输出序列局部由上一阶段输出和当前阶段的输入局部构成）
对于上面给出的疑问（那些权重应该怎么给），Attention给出的答案是，让输出序列决定。

吴恩达深度学习课程
在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。