位置编码 (Positional Encoding) 的生成及详细解释

最新推荐文章于 2025-03-09 21:43:35 发布

six.学长

最新推荐文章于 2025-03-09 21:43:35 发布

阅读量1.6k

点赞数 15

分类专栏： informer 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51200050/article/details/139630545

版权

位置编码 (Positional Encoding) 的生成及详细解释

位置编码是Transformer模型中的一个重要组成部分，用于给输入序列添加位置信息，以弥补自注意力机制中缺乏顺序感的问题。位置编码通常基于正弦和余弦函数生成，其公式如下：

$[ PE_{(pos, 2i)} = \sin\left(\frac{pos}{10000^{2i/d_{\text{model}}}}\right) ] [ PE_{(pos, 2i+1)} = \cos\left(\frac{pos}{10000^{2i/d_{\text{model}}}}\right) ]$

其中：

( pos ) 是位置索引，即时间步长。
( i ) 是维度索引。
( d_model ）是词向量的维度。

工作原理

位置编码通过上述公式生成一个与输入向量具有相同维度的编码向量。这个编码向量在每个位置上生成独特的值，使模型能够区分序列中的不同时间步。

详细步骤

初始化位置和维度：
- 确定输入序列的长度 ( L ) 和词向量的维度 ( d_model )。
计算正弦和余弦值：
- 对于每个位置 ( pos ) 和每个维度 ( i )，根据公式计算正弦和余弦值。
生成位置编

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。