transformer 位置编码源码解读

最新推荐文章于 2024-07-25 17:49:34 发布

有梦想的咸鱼_

最新推荐文章于 2024-07-25 17:49:34 发布

阅读量265

点赞数 4

文章标签： transformer 深度学习人工智能

本文链接：https://blog.csdn.net/qq_43570528/article/details/139579978

版权

在这里插入图片描述

import torch
import math

def get_positional_encoding(max_len, d_model):
    """
    计算位置编码

    参数：
    max_len -- 序列的最大长度
    d_model -- 位置编码的维度
    
    返回：
    一个形状为 (max_len, d_model) 的位置编码张量
    """
    positional_encoding = torch.zeros(max_len, d_model)
    position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1)
    div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))
    
    positional_encoding[:, 0::2] = torch.sin(position * div_term)
    positional_encoding[:, 1::2] = torch.cos(position * div_term)
    
    return positional_encoding

# 示例参数
max_len = 100
d_model = 512

# 计算位置编码
positional_encoding = get_positional_encoding(max_len, d_model)
print(positional_encoding)

这里为什么要这么实现
div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))
在这里插入图片描述

div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model))

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

有梦想的咸鱼_

关注关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
transformer 位置编码源码解读

transformer 位置编码源码解读
复制链接

扫一扫

Medical transformer源码解读

qq_52053775的博客

11-06

1231

数据预处理部分比较常规，进行了一下裁剪和色彩增强操作，比较简单，不在多说。另外，官方github上提供了数据。

Transformer源码解读 PyTorch

C橘子

12-13

2218

刚开始学习深度学习几个月，对于很多近年来提到的模型都不是很清楚，读到Transformer时，注意力是什么都不知道。后面读了一些其他相关的论文逐渐开始懂一些，但是不看到代码，总是有些地方不明白，所以找到了PyTorch实现的Transformer代码进行分析，同时也记录下来，希望能够帮助到大家。

参与评论您还未登录，请先登录后发表或查看评论

Transformer源码Pytorch版解读

yezzy的博客

07-02

312

Transformer模型源码Pytorch版解读

Swin_Transformer源码解读

wulele2的博客

06-01

3073

文章目录前言1、模型总体结构2、使用步骤1.引入库2.读入数据总结前言本文记录下swin_transformer的令我比较困惑的部分：相对位置编码和滑动窗口自注意力。非常感谢大佬的解析：知乎链接。本篇博客只是在该知乎链接基础上分析下源代码，建议读者先理解上述链接解析。 1、模型总体结构 swin_transformer的结构对标的是resnet，即特征图每经过一个block尺寸降倍，通道数翻倍。简单说下网络的pipline： 2、使用步骤 1.引入库 2.读入数据总结 ...

Transformer系列：快速通俗理解Transformer的位置编码

2401_84494441的博客

06-16

978

将[我，爱，你]输入一组Q，K，V组成的Self-Attention产出的向量，和[你，爱，我] 输入同一组Q，K，V组成的Self-Attention产出的向量，两者的结果每个词/字的embedding输出一致，仅仅是在矩阵的位置调换了一下（1和3对调）。设置max_len为每个句子的最大长度为50，d_emb为每个词的embedding的维度为256，最终得到一个[50, 256]的位置编码矩阵，每一行代表一个位置的位置编码结果，每一列代表某个词在某个位置编码分量上的值。

全网最详细的Transformer的源码解读

JamesX666的博客

08-22

964

transformer源码解读

Pytorch深度解析：Transformer嵌入层源码逐行解读

fengbeely的博客

06-17

677

Transformer实现以及Pytorch源码解读（一）-数据输入篇》作为知识储备。Embedding的过程，其实就是为每个单词对应一个向量的过程。该向量为（0，1）正太分布，该矩阵在Embedding的实例化过程就已经被初始化完成。在调用Embedding示例的时候即forward开始工作的时候，只是做了一个匹配的过程，也就是将的对应关系应用到input上。

Transformer实现以及Pytorch源码解读（三）-位置编码Position Encoding——史上最容易理解

铁血军的小博客

12-22

3797

位置编码的数学定义如下公式所示：从公式上可以看出，在对位置信息进行编码的过程中主要涉及到两个索引：p和i，其中，p表示，某个单次在一个句子中的位置，该位置用索引表示，索引从0开始；其中的i表示，某个数值，在embedding后形成的向量中的位置，该位置也用索引表示，并且索引从0开始。可以搭配下图进行理解。比如0.03这个元素的p=0并且i=0, 而0.07这个元素的p=1,i=1。从inputs到向量矩阵的表示过程可以参考我前面的博客。

Transformer源码解读-读书笔记

scar2016的博客

03-02

1412

文章目录1. 模型2. 基于位置的前馈网络3. 残差连接和层规范化4. 编码器5. 解码器6. 训练7. 小结 1. 模型 2. 基于位置的前馈网络 3. 残差连接和层规范化 4. 编码器 5. 解码器 6. 训练 7. 小结

Vision Transformer 源码解读

02-03

因此使用Transformer架构做CV任务，只需要加上一层embbeding就可以套用Transformer架构了，一次卷积就可以得到图像全局的特征，当然也要加上位置编码得到位置信息。有了向量序列，就可以进行self-Attention的堆叠...

基于Transformer的detr目标检测算法，源码解读

02-08

2. Transformer编码器：将特征图输入Transformer编码器，利用自注意力机制和全连接层获取位置的上下文信息。 3. 对象查询：引入特殊的“对象”查询向量，指导模型在每个位置关注的对象类别。 4. 解码器：将...

目标检测源码解读1111

12-26

DETR的源码解读可以帮助我们深入理解Transformer如何应用于目标检测，以及如何通过精心设计的损失函数和训练策略实现高效的检测效果。通过对DETR的源码进行分析和实践，我们可以学习到如何结合传统卷积神经网络和...

人工智能P5第5期2022年92022论文必备-Transformer实战系列

最新发布

07-26

transformer 92022论文必备-Transformer实战系列 8行为识别实战 7图像分割实战 6综合项目-物体检测经典算法实战 5Opencv图像处理框架实战 ...8detr目标检测源码解读 ...5-位置编码的作用与效果萌萌家.mp4.mp4 46.5M

基于深度学习的商品推荐

weixin_42605076的博客

07-22

919

昇思25天学习打卡营第21天|RNN实现情感分类

人工智能视觉分析算法学习实践和经验分享。

07-21

667

Mindspore框架循环神经网络RNN模型实现情感分类|（一）数据集准备Mindspore框架循环神经网络RNN模型实现情感分类|（二）RNN模型Mindspore框架循环神经网络RNN模型实现情感分类|（三）模型训练与推理tips:安装依赖库。

从零开始：构建基于深度学习的实时跌倒检测系统（UI界面+YOLO代码+数据集）

a871923942的博客

07-22

775

基于深度学习的社交网络分析

weixin_42605076的博客

07-25

814

基于深度学习的社交网络分析（Social Network Analysis, SNA）是利用深度学习技术对社交网络中的结构、模式和用户行为进行分析和理解。这一领域广泛应用于用户推荐、情感分析、社区检测、信息传播和隐私保护等方面。

深度学习 —— 个人学习笔记6（权重衰减）

Springer的博客

07-22

388

本文章为个人学习使用，版面观感若有不适请谅解，文中知识仅代表个人观点，若出现错误，欢迎各位批评指正。文中部分知识参考：B 站 —— 跟李沐学AI；

transformer源码解读

09-01

嗨！对于Transformer源码的解读，我可以给你一些基本的指导。请注意，我不能提供完整的源代码解读，但我可以帮助你理解一些关键概念和模块。 Transformer是一个用于自然语言处理任务的模型，其中最著名的应用是在机器翻译中。如果你想要深入了解Transformer的实现细节，我建议你参考谷歌的Transformer源码，它是用TensorFlow实现的。在Transformer中，有几个关键的模块需要理解。首先是"self-attention"机制，它允许模型在处理序列中的每个位置时，同时关注其他位置的上下文信息。这个机制在Transformer中被广泛使用，并且被认为是其性能优越的主要原因之一。另一个重要的模块是"Transformer Encoder"和"Transformer Decoder"。Encoder负责将输入序列转换为隐藏表示，而Decoder则使用这些隐藏表示生成输出序列。Encoder和Decoder都由多个堆叠的层组成，每个层都包含多头自注意力机制和前馈神经网络。除了这些核心模块外，Transformer还使用了一些辅助模块，如位置编码和残差连接。位置编码用于为输入序列中的每个位置提供位置信息，以便模型能够感知到序列的顺序。残差连接使得模型能够更好地传递梯度，并且有助于避免梯度消失或爆炸的问题。了解Transformer的源码需要一定的数学和深度学习背景知识。如果你对此不太了解，我建议你先学习相关的基础知识，如自注意力机制、多头注意力机制和残差连接等。这样你就能更好地理解Transformer源码中的具体实现细节。希望这些信息对你有所帮助！如果你有任何进一步的问题，我会尽力回答。