transformer学习之位置编码

89 篇文章 50 订阅 ¥29.90 ¥99.00

参考原文➡️Transformer Architecture: The Positional Encoding

题目

位置编码(POSITIONAL ENCODING)

简介

顺序的重要性

一个缺少顺序的句子是没有灵魂的,就好比一个人说话前言不搭后语,让人完全摸不着头脑。语言就是在规范着人们说话的方式,它是一种人与人最直接最快速交流的方式,所以要想使得别人能够听懂你说的话,一定要按照顺序来讲。

为什么transformer要引入

在transformer中它是通过Q、K、V三个矩阵之间进行计算,对于每一个单词都是一次性取计算的结果,并没有像RNN那样有时序关系,这在某种程度上似乎就制约了transformer的发展,试问哪一个句子没有前后顺序之分?所以,引入位置编码(positional encoding)势在必行!

它是什么

读到这里,我们大致了解了位置编码的作用就是弥补原本用Attention实现下没有时序信息的不足,所以每个单词在编码的时候根据单词在句子中的位置信息进行二次加工。

怎么实现

要回答这个问题,我们就必

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

365JHWZGo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值