Transformer 位置编码（Positional Encoding）

VAMOT

于 2024-03-01 06:57:03 发布

阅读量305

点赞数 1

文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48633207/article/details/136384993

版权

原式（见1706.03762.pdf (arxiv.org)）

$PE(pos, 2i) =sin(\frac{pos}{10000^{\frac{2i}{d_{model}}}})$

$PE(pos, 2i+1) =cos(\frac{pos}{10000^{\frac{2i}{d_{model}}}})$

合并化简得

$PE(pos, i) =\left\{\begin{matrix} sin(\frac{pos}{10000^{\frac{i}{d_{model}}}}) & \text{if i is even} \\ cos(\frac{pos}{10000^{\frac{i-1}{d_{model}}}}) & \text{if i is odd} \end{matrix}\right.$

参数解读：

pos: 词向量的位置
i：维度的位置
$d_{model}$ ：词向量的维度大小

以一个2个词，每个词维度维度为4的输入为例：

	维度0（i=0）	维度1（i=1）	维度2（i=2）	维度3（i=3）
词向量0（pos=0）	$sin(\frac{0}{10000^{\frac{0}{4}}})$	$cos(\frac{0}{10000^{\frac{0}{4}}})$	$sin(\frac{0}{10000^{\frac{2}{4}}})$	$cos(\frac{0}{10000^{\frac{2}{4}}})$
词向量1（pos=1）	$sin(\frac{1}{10000^{\frac{0}{4}}})$	$cos(\frac{1}{10000^{\frac{0}{4}}})$	$sin(\frac{1}{10000^{\frac{2}{4}}})$	$cos(\frac{1}{10000^{\frac{2}{4}}})$

由上可见，位置编码与词向量所包含的值无关，仅与位置和维度大小有关。

代码示例如下：

import numpy as np


def PE(pos, i, dmodel):
    n = 10000
    if i % 2 == 0:
        # i is even
        return np.sin(pos / np.power(n, (i / dmodel)))
    else:
        # i is odd
        return np.cos(pos / np.power(n, ((i - 1) / dmodel)))


sample = np.zeros((2, 4))  # 2 word vectors; each vector has four dimensions
dmodel = sample.shape[1]
for pos in range(sample.shape[0]):
    for i in range(sample.shape[1]):
        sample[pos][i] = np.round(PE(pos, i, dmodel), 5)
print(sample)

# output
# [[0.         1.         0.         1.        ]
#  [0.84147098 0.54030231 0.00999983 0.99995   ]]

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
Transformer 位置编码（Positional Encoding）

Transformer 用的位置编码
复制链接

扫一扫

VAMOT CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

109万+: 周排名

8万+: 总排名

8198: 访问

: 等级

185: 积分

63: 粉丝

74: 获赞

16: 评论

101: 收藏

私信

关注

热门文章

分类专栏

PyTorch图像分类系列 2篇

最新评论

PyTorch图像分类系列——流程概览
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
PyTorch图像分类系列——流程概览
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Transformer 位置编码（Positional Encoding）
CSDN-Ada助手: 恭喜作者发布了第8篇博客，标题为“Transformer 位置编码（Positional Encoding）”。内容深入浅出地介绍了Transformer的位置编码，让我受益匪浅。希望作者能够继续分享更多关于深度学习的知识，可以考虑探讨Transformer在不同任务上的应用，或者深入研究Transformer网络结构的优化方法等方面的内容。期待您的下一篇精彩文章！
一些用于NLP分类任务的简单模型示例
CSDN-Ada助手: 恭喜作者发布了新的博客！这篇关于NLP分类任务的简单模型示例非常有用，对于想要入门NLP领域的读者来说，肯定会受益匪浅。不过，我个人觉得如果能在下一篇博客中加入一些具体的案例分析或者应用场景的讨论，会让读者更加深入地理解这些模型的实际应用。期待作者在未来的创作中能够继续分享更多有价值的内容！
TensorFlow ResNet18
全栈小5: 你的文章很有深度和广度，不仅表达了你的思考和理解，也激发了读者的思考和感悟【TensorFlow ResNet18，博主这篇文章，值得一看】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。