取个名字真难呐-CSDN博客

原创 torch.index_select函数测试

index_select 函数的方法是可以按照序号的方式随机抽取指定维度的向量，比如按照行进行采样，按照。

2025-04-06 11:13:51 212 1

原创 Glow 论文随手笔记

glow 模型的优势在于能够自定义模型的forward前向计算，和自定义reverse 后向运算，论文太精彩了，匆匆笔记，代码也不完全，后续更新吧。代码跑不起来，后续优化，但glow论文的思路非常的优秀。并且应用了将矩阵按照列分割的方式进行拟合，简直就是麻省理工学院教授吉尔伯特・斯特朗（Gilbert Strang）老爷子的线性代数的思想再现，后续论文需要重构，用更好的结构和思路优化才行。

2025-04-04 15:55:52 241 1

原创 GAN随手笔记

GAN是生成对抗网络，主要由G生成器，D判别器组成，具体形式如下。

2025-03-30 21:30:15 421

原创 weight_norm随手笔记

经过pytorch中的torch.nn.utils.parametrizations.weight_norm包装后，只是将原来的矩阵weight分解为两个部分。

2025-03-26 10:14:18 343

原创相对位置2d矩阵和kron运算的思考

在结果中，我们发现很多重复的值，这就让我联想到kron运算。

2025-03-25 20:34:13 547

原创 torch.meshgrid代码测试

x_meshgrid,y_meshgrid=torch.meshgrid(x_tensor,y_tensor) 函数的功能是根据x_tensor,y_tensor来生成网格矩阵x_meshgrid,y_meshgrid,注意这里的x_tensor和y_tensor的方向和实际方向相反，具体如下描述。

2025-03-24 11:04:26 201

原创 torch.split 函数测试

torch.split 的作用是将矩阵A按照指定的方式进行切割成不同大小的子矩阵。

2025-03-23 14:36:24 359

原创 torch.repeat 等效 kron运算

【代码】torch.repeat。

2025-03-22 12:57:03 126

原创 Torch.expand等效矩阵相乘

【代码】Torch.expand等效矩阵相乘。

2025-03-22 11:11:51 200

原创 random_masking 函数测试

【代码】random_masking 函数测试。

2025-03-19 17:02:52 267

原创 LayerScale类测试

在神经网络够着过程中，比如我们使用dropout功能时，需要丢弃部分的参数，但是为了保证训练中参数在dropout前后的期望保持一致，所以有必要将矩阵等比放大一定的比例，这样在丢弃前后参数的期望值就保持不变，这样就引申出一个新的类。

2025-03-19 10:08:34 321

原创 tensor.flatten(2).transpose(1,2)

对于一个四维向量来说，A=[batch_size,in_channles,height,width]

2025-03-18 14:22:54 365

原创 torch.argsort&torch.gather

torch.argsort 的作用是可以将矩阵中的元素进行从小到大排序，得到对应的序号。假设我们有一个向量a表示如下。如果我想通过序号向量b来直接从小到大排序的向量c,那么就需要torch.gather函数。那么从小到大可以得到排序向量为b。

2025-03-17 21:43:11 630

原创 42. MAE(Masked Autoencoders Are Scalable Vision Learners)

step4: 将25%未被掩码的表征向量和 75%可学习的相同的表征向量一起，根据原来的位置编码来组合成新的表征矩阵进入decoder解码器。step1: 将输入图像进行patch分块处理，并通过均匀分布来将75%的Patch块进行掩码遮掉处理。step5: 将decoder 生成新的解码特征向量通过逆块unpatch的方式重新生成新的图像。step2: 将剩下的25%未被掩码块组成新的矩阵后，拉成一个矩阵A后进行映射成新的隐藏表征。step3: 将被掩码的75%的块映射后用同一个可学习的向量进行表征。

2025-03-14 20:11:13 545

原创 nn.Identity 单位矩阵，同一矩阵

在搭建网络结构中，为了保证搭建的网络具有高度扩展性和后续调试模型框架，在保证整体结构完整情况下，用nn.Identity 进行占位符处理。

2025-03-04 12:57:49 295

原创关于attention中num_head 多头的小思考

在transformer中我们需要将自注意力q,k,v进行注意力attention计算，但有时候，我们用一个行向量表示一个样本的时候，发现行向量太长了，这样整体的计算匹配机制比较差，为了提高注意力匹配率，我们引入了多头注意力。

2025-03-02 10:45:59 448

原创 torch.permute测试

torch.permute 可以一次性的将矩阵的维度进行调换。比如我们有矩阵A的形状为[2,3,4,4],permute矩阵A为[0,2,3,1]那么可以得到矩阵B的形状为[2,4,3,3]的矩阵，具体的作用是为了后续进行维度的扩大和缩小。

2025-02-26 10:17:55 371

原创 rnn.pad_sequence测试

【代码】rnn.pad_sequence测试。

2025-02-19 22:15:29 1042

原创 einops测试

einops 主要是通过爱因斯坦标记法来处理张量矩阵的库，让矩阵处理上非常简单。

2025-02-19 21:16:23 543

原创向量元素间是否相等mask矩阵

假设有一个向量a_vector[1,2,1,4]此时就两个1相等，所以生成一个mask矩阵用来判断两个元素是否相等。给定一个向量a_vector，生成一个mask矩阵用来判断向量元素间是否相等。

2025-02-15 20:27:30 454

原创 kron积计算mask类别矩阵

基于kron 积的mask矩阵

2025-02-13 12:36:00 1096

原创 window patch按块分割矩阵

将一个三维矩阵按照window的大小进行拆分成多块2x2窗口矩阵，具体如下图所示。

2025-02-12 13:50:39 355

原创 F.unfold 四维展开测试

【代码】F.unfold 四维展开测试。

2025-02-11 20:33:41 229

原创多头自注意力中的多头作用及相关思考

【代码】多头自注意力中的多头作用及相关思考。

2025-02-10 22:26:47 212

原创 torch.roll演算及代码测试

torch.roll 的作用是可以将矩阵A中的元素按照指定的维度移动指定步长。

2025-02-09 17:37:36 273

原创 torch_bmm验算及代码测试

torch.bmm的作用是基于batch_size的矩阵乘法,torch.bmm的作用是对应batch位置的矩阵相乘，比如，

2025-02-09 11:23:05 561

原创 torch_unbind&torch_chunk

torch.chunk 的作用是将矩阵按照指定维度分割成指定份数，先按照份数来均匀切割，最后的不够就单独保留。torch.unbind的作用是将矩阵沿着指定维度进行解耦分割成一个。

2025-02-08 17:37:40 571

原创 torchtext.get_tokenizer

【代码】torchtext.get_tokenizer。

2025-02-05 22:48:08 223

原创 embeddingbag词袋

词袋embeddingbag 是在embedding词表的基础上演变起来的,nn.embedding的作用是构建一个词表，通过输入index序号来索引词对应的词向量，是可以根据词索引index进行forward计算的，embeddingbag的作用是可以根据offset来按照序号将索引按照一批批来计算，offset相当于菜刀，根据offset索引将引入的词向量求均值或者求和表示出来。

2025-02-05 17:10:21 349