Attention Is All You Need

1.简介

            接着上一篇Attention机制,我们来谈一谈Transformer。Attention Is All You Need,这句话的句式是不是很熟悉。对!想起了那句著名的You Only Look Once!you only look once 说的是,你只看一次,不需要什么RPN提取特征的网络。Attention Is All You Need说的是,你只需要注意力机制,不需要什么RNN的。不需要RNN的原因是,它不利于并行的训练,因为我们都知道RNN每一个时刻会基于上一个时刻的状态。历史就是一个不断摒弃,推陈出新的过程。大神们之间的互怼,新理论把旧理论拍死在沙滩上,又被更新的理论拍死在沙滩上,为我们带来了如今的繁荣与昌盛。摒弃了RNN之后的Transformer应该怎么演呢?让我们来一步步揭开它的庐山真面目。

2.小故事

             在一个月黑风高的夜晚,有两队起义者决定离开RNN的阵营自谋出路。其中一队的领袖叫encoder,另一队的领袖叫decoder。他们从阵营中偷走Attention秘籍,各自复印了一份揣在兜里。为了分散追击者的注意力,他们分两条路前进,向着一probabilities的村庄前进。
              encoder这一队从西边的小路前进,为了方便人员管理,他们给每个人进行编号,在队伍里面编号就代表这个人。同时为了防止大家走散,给每个人在队伍中固定了位置。后来他们决定兵分三队前进,每一队又分为

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值