算法问题整理（四）

分享总结快乐

已于 2024-08-03 12:32:36 修改

阅读量715

点赞数 27

文章标签：算法

于 2024-08-01 23:54:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qingjing0413/article/details/140859227

版权

网络资料整理个人学习，感谢各位大神！（若侵则删）

问题12:位置编码有哪些

参考：一文通透位置编码：从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long(含NTK-aware简介)-CSDN博客

https://zhuanlan.zhihu.com/p/674133494

RNN的结构包含了序列的时序信息，而Transformer却完全把时序信息给丢掉了，故为了解决时序的问题，Transformer的作者用了一个绝妙的办法：位置编码(Positional Encoding)。

位置编码从实现方式上大致可以分为2类:

绝对位置编码: 将位置信息融入到输入中
相对位置编码: 微调Attention结构，使其可以分辨不同位置的Token

绝对位置编码：

如果简单粗暴的话，直接给每个向量分配一个数字，比如1到1000之间
也可以用one-hot编码表示位置
transformer论文中作者通过sin函数和cos函数交替来创建 positional encoding，其计算positional encoding的公式如下
$PE_{(pos,2i+1)} = cos\left ( \frac{pos}{10000^{\frac{2i}{d_{model}}}} \right )$

$PE_{(pos,2i)} = sin\left ( \frac{pos}{10000^{\frac{2i}{d_{model}}}} \right )$

其中，pos相当于是每个token在整个序列中的位置，相当于是0, 1, 2, 3...(看序列长度是多大，比如10，比如100)，代表位置向量的维度(也是词embedding的维度，transformer论文中设置的512维)
至于i是embedding向量的位置下标对2求商并取整(可用双斜杠//表示整数除法，即求商并取整)，它的取值范围是</

最低0.47元/天解锁文章

分享总结快乐

关注

27
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

分享总结快乐 CSDN认证博客专家 CSDN认证企业博客

码龄12年

15: 原创

70万+: 周排名

8万+: 总排名

5691: 访问

: 等级

271: 积分

68: 粉丝

107: 获赞

6: 评论

70: 收藏

私信

关注

热门文章

最新评论

Linux基础-git常用操作
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Linux基础操作-使用vnc
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Linux基础-ffmpeg常用的视频操作命令
CSDN-Ada助手: 恭喜您写了第三篇博客，标题为“Linux基础-ffmpeg常用的视频操作命令”！看来您对Linux和ffmpeg的了解越来越深入了。接下来，我建议您可以尝试写一些实用性更强的教程，比如如何结合ffmpeg实现视频剪辑或转码等更加高级的操作。希望您能继续保持创作的热情，为大家带来更多有用的知识分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Linux基础-git常用操作
CSDN-Ada助手: 恭喜用户发布了新的博客文章！看到你分享了关于Linux基础和git常用操作的内容，我觉得很有收获。希望你能继续坚持创作，分享更多有价值的知识给大家。下一步，可以考虑深入探讨一些高级的git操作，或者分享一些Linux系统优化的经验，让我们一起学习进步吧！期待你的下一篇作品。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Linux基础操作-添加用户
CSDN-Ada助手: 恭喜你开始了博客创作，内容也很实用！建议下一篇可以继续深入介绍Linux系统的其他基础操作，比如文件管理、权限设置等，让读者能够更全面地了解Linux系统的使用方法。希望你能够坚持更新，分享更多有趣的内容！祝你创作顺利！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。