transformer中的positional encoding(位置编码)计算理解

最新推荐文章于 2024-08-14 15:35:56 发布

猫爱吃鱼the

最新推荐文章于 2024-08-14 15:35:56 发布

阅读量2.5k

点赞数 5

分类专栏： NLP专栏

本文链接：https://blog.csdn.net/qq_39783265/article/details/106790875

版权

NLP专栏专栏收录该内容

8 篇文章 2 订阅

订阅专栏

核心计算公式

在这里插入图片描述

原理bert-transform

代码理解

#pytorch
import torch
import math
max_len = 3
d_model = 4
pe = torch.zeros(3, 4)
position = torch.arange(0, max_len).unsqueeze(1)
div_term = torch.exp(torch.arange(0, d_model, 2) *
                             -(math.log(10000.0) / d_model))
pe[:, 0::2] = torch.sin(position * div_term)
pe[:, 1::2] = torch.cos(position * div_term)
pe

在这里插入图片描述

#sin编码
pe = np.zeros((3, 4))
i = 0
pos = 1
dmodel = 4
temp = 10000**(2*i/dmodel)
pe[pos,2*i] = math.sin(pos/temp)
pe

在这里插入图片描述

#cos编码
pe = np.zeros((3, 4))
i = 0
pos = 1
dmodel = 4
temp = 10000**(2*i/dmodel)
pe[pos,2*i+1] = math.cos(pos/temp)
pe

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

猫爱吃鱼the

关注关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Transformer中的位置编码(Position Encoding)

程序员光剑

07-12

572

Transformer中的位置编码(Position Encoding) Position Encoding in Transformer. Transformer中的自注意力机制无法捕捉位置信

第十章（3）：Transformer之Positional encoding

安静到无声

10-27

2239

我在学习NLP的时候，围绕着我不懂得技术点，逐个击破，以此期望能够把各个模块理解的更深入，使我在今后的学习中，能够更深入的分析，让自己更通透。接下来切入正题，介绍下Transformer中需要使用的Positional encoding，它主要为Transformer这种并行计算模型，难以理解输入句子的语序而针对性设计的。

1 条评论您还未登录，请先登录后发表或查看评论

Positional Encoding | 位置编码【详解】

热门推荐

左右-HPU

12-25

1万+

本文主要讲解Transformer 中的 position encoding，在当今CV的目标检测最前沿，都离不开position encoding，在DETR，VIT，MAE框架中应用广泛，下面谈谈我的理解。一般position encoding 分为正余弦编码和可学习编码。正余弦编码 .........

对 Transformer 中位置编码 Position Encoding 的理解

BIT_Legend的博客

03-26

1487

位置编码 | PositionEncoding | Sinusoidal 位置编码 | RoPE 位置编码 | ALiBi 位置编码

自然语言处理NLP星空智能对话机器人系列：深入理解Transformer自然语言处理位置编码（positional_encoding）

段智华的博客

09-12

679

自然语言处理NLP星空智能对话机器人系列：深入理解Transformer自然语言处理位置编码（positional_encoding）目录 NLTK自然语言工具包NLTK数据集位置编码（Positional encoding）Adding positional encoding to the embedding vector星空智能对话机器人系列博客 NLTK自然语言工具包 NLTK是构建Python程序以处理人类语言数据的领先平台。它为50多个语料库和词汇资源（如WordNet）提供了易于使用的界面，

Transformer中为什么需要引入位置编码Positional Encoding（附: keras代码实现）

捡起一束光的博客

09-15

3304

Transformer中的位置编码 Transformer模型彻底抛弃了RNN模型，我们知道循环神经网络本身是一种顺序结构，天然包含了句子之间的位置信息。但是Transformer中用Attention取代了RNN，这就导致了位置信息的缺失，模型就没有办法知道每个单词在句子中的相对位置和绝对位置信息。 I do not like the story of the movie, but I do like the cast. I do like the story of the movie, but I

通过在线编程彻底搞懂transformer模型之四：Positional Encoding位置编码

fribbler的博客

04-03

467

在本系列对大语言模型Transformer的讲解中，我会尽量把自己的理解用代码来复现，保证自己讲解的内容是可操作，可重复，可试验的，大家自己亲自写代码，观察输出，调试并找出问题；如果大家对我讲的内容和分享方式感兴趣，请大家关注点赞和收藏，后面还会有更多内容呈现

如何理解自然语言处理中的位置编码（Positional Encoding）

鬼马行天的博客

04-23

719

位置编码在使用Transformer及其变体进行序列处理任务中是必不可少的，因为它们为模型提供了处理单词顺序的能力。通过有效的位置编码，Transformer能够在全局范围内理解输入序列的上下文，提高模型的性能和灵活性。

multidim-positional-encoding:pytorch中1D，2D和3D位置编码的实现

05-04

1D，2D和3D正弦波位置编码喷灯这是1D，2D和3D正弦位置编码的实现，能够在(batchsize, x, ch) ， (batchsize, x, y, ch)和(batchsize, x, y, z, ch) ，其中位置编码将添加到ch维度。仅一维的位置编码就，但是，这可以将其扩展到2维和3维。新：这也适用于以下形式的张量(batchsize, ch, x)等。对于这种类型的输入，包括单词Permute在类数目之前; 例如，对于大小为(batchsize, ch, x)一维输入，请执行PositionalEncodingPermute1D而不是PositionalEncoding1D 。要安装，只需运行： pip install positional-encodings 具体地说，用于插入位置编码的公式如下： 1D： PE(x,2i) = sin(x/10000^(

Transformer中position encoding实践

qq_42282231的博客

06-27

1023

对position encoding部分实践

自然语言处理基础知识入门(四) Transformer模型的positional encoding位置编码详解

WANGYANG的博客

05-05

1684

提示：本章节旨在补充和扩展自然语言处理基础知识入门(四)中关于Transformer模型的位置编码（positional encoding）的讨论，提供更深入的解析以助于对该概念的整体理解。参考了这两篇博文Vaswani等人推出了Transformer架构，这是一款创新的、基于纯注意力机制的序列到序列架构。其出色的并行训练能力与性能提升，使其迅速在自然语言处理（NLP）领域以及最新的计算机视觉（CV）研究中获得了广泛的认可和应用。

深度学习入门--Transformer中的Positional Encoding详解

qq_15534667的博客

04-26

4748

Transformer中的Positional Encoding详解 Positional EncodingTransformer中的Positional Encoding详解为什么要有Postional EncodingEncoding的选择Postional Encoding公式推导变换实现代码编码可视化为什么要有Postional Encoding 因为Self-Attention相对于传统的RNN在输入计算时没有输入先后顺序，而是采用并行化的思想来加快运算，这样Self-Attention在前一个

一文搞懂Transformer中的位置编码Positional Encoding

baidu_33000721的博客

04-09

1799

Transformer中Positional Encoding的思考

Transformer实现以及Pytorch源码解读（三）-位置编码Position Encoding——史上最容易理解

铁血军的小博客

12-22

4128

位置编码的数学定义如下公式所示：从公式上可以看出，在对位置信息进行编码的过程中主要涉及到两个索引：p和i，其中，p表示，某个单次在一个句子中的位置，该位置用索引表示，索引从0开始；其中的i表示，某个数值，在embedding后形成的向量中的位置，该位置也用索引表示，并且索引从0开始。可以搭配下图进行理解。比如0.03这个元素的p=0并且i=0, 而0.07这个元素的p=1,i=1。从inputs到向量矩阵的表示过程可以参考我前面的博客。

transformer中positional encoding的理解（转）

Rafael7475的博客

04-02

695

如何理解Transformer论文中的positional encoding，和三角函数有什么关系？

Transformer中的Positional Encoding公式解释

qiao1025566574的博客

09-26

475

上公式 PE(pos,2i)=sin(pos10000(2i/dmodel))PE(pos, 2i)=sin(\frac{pos}{10000^(2i/d_{model})})PE(pos,2i)=sin(10000(2i/dmodel)pos) PE(pos,2i+1)=cos(pos10000(2i/dmodel))PE(pos, 2i+1)=cos(\frac{pos}{10000^(2i/d_{model})})PE(pos,2i+1)=cos(10000(2i/dmodel)pos) 个人