数据重排——Rearrange

人工智能技术派

于 2024-04-30 21:44:44 发布

阅读量339

点赞数 7

文章标签： pytorch python

本文链接：https://blog.csdn.net/morespeech/article/details/137001550

版权

示例：Rearrange('b c (h p1) (w p2) -> b (c p1 p2) h w', p1=2, p2=2)

数据重排（rearrange）通常用于深度学习框架中调整多维数据的维度顺序。这种操作在处理图像数据、执行矩阵乘法或构建如卷积神经网络（CNN）等架构时非常常见。

在给定的表达式中：

'b' 代表批次大小（batch size）。
'c' 代表通道数（number of channels）。
'h' 和 'w' 分别代表数据的高度（height）和宽度（width），例如图像的行数和列数。
'p1' 和 'p2' 是对维度进行操作的参数，它们在这里指定了如何对中间的两个维度进行排列。

具体来说：

原始数据格式：原始数据被假定为具有形状 (batch_size, channels, height * p1, width * p2)。这里，height * p1 和 width * p2 表示原始的高度和宽度被重复或扩展了 p1 和 p2 倍。
重排操作：重排操作将数据从形状 (batch_size, channels, height * p1, width * p2) 转换为 (batch_size, (channels * p1 * p2), height, width)。
扩展通道维度：在这个过程中，channels * p1 * p2 表示新的通道数是原始通道数 channels 乘以 p1 和 p2 的乘积。这意味着原始的通道数据被扩展或重复以填充新的通道维度。
结果数据格式：最终数据的形状变为 (batch_size, new_channels, height, width)，其中 new_channels = channels * p1 * p2。

示例代码（PyTorch）：

import torch

# 假设 x 是原始数据，其形状为 (batch_size, channels, height * p1, width * p2)
x = torch.randn(batch_size, channels, height * p1, width * p2)

# 重排操作，将 'x' 的形状从 (b, c, h*p1, w*p2) 转置为 (b, c*p1*p2, h, w)
y = x.view(batch_size, channels * (p1 * p2), height, width)

这种重排操作在深度学习中很有用，特别是在涉及对输入数据进行维度变换或特征映射时，例如在卷积神经网络的不同层之间传递数据，或者在实现如 Transformer 模型中的自注意力机制时调整数据的形状。

人工智能技术派

关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
数据重排——Rearrange

这种重排操作在深度学习中很有用，特别是在涉及对输入数据进行维度变换或特征映射时，例如在卷积神经网络的不同层之间传递数据，或者在实现如 Transformer 模型中的自注意力机制时调整数据的形状。数据重排（rearrange）通常用于深度学习框架中调整多维数据的维度顺序。示例：Rearrange('b c (h p1) (w p2) -> b (c p1 p2) h w', p1=2, p2=2)这意味着原始的通道数据被扩展或重复以填充新的通道维度。表示原始的高度和宽度被重复或扩展了。
复制链接

扫一扫