零基础也可以探索 PyTorch 中的上采样与下采样技术

E寻数据

已于 2024-01-08 19:38:50 修改

阅读量1.6k

点赞数 23

分类专栏： pytorch python 深度学习文章标签：深度学习机器学习 pytorch python 人工智能

于 2024-01-08 10:45:50 首次发布

本文链接：https://blog.csdn.net/qq_42452134/article/details/135449680

版权

深度学习同时被 3 个专栏收录

77 篇文章 45 订阅

订阅专栏

pytorch

53 篇文章 1 订阅

订阅专栏

python

53 篇文章 0 订阅

订阅专栏

文章详细介绍了PyTorch中几个关键的图像处理子模块，如PixelShuffle用于超分辨率，PixelUnshuffle用于降采样，以及不同类型的Upsample方法，包括最近邻和双线性插值，及其在实际任务中的应用和注意事项。

摘要由CSDN通过智能技术生成

torch.nn子模块Vision Layers详解

nn.UpsamplingNearest2d

nn.UpsamplingBilinear2d

torch.nn子模块Vision Layers详解

nn.PixelShuffle

torch.nn.PixelShuffle 是 PyTorch 深度学习框架中的一个子模块，主要用于图像超分辨率（Super Resolution）任务。这个模块通过重新排列输入张量（Tensor）的元素，从而将图像的分辨率提高。

用法与用途

用法: PixelShuffle 接收一个输入张量，并按照指定的上采样因子（upscale factor）重新排列张量中的元素，以提高图像的分辨率。
用途: 它主要用于图像超分辨率任务，如将低分辨率的图像转换成高分辨率图像。这在视频增强、图像恢复等领域非常有用。

使用技巧

选择合适的上采样因子: 上采样因子决定了图像分辨率的提升程度。因子越大，分辨率提升越明显，但同时也要求输入张量有足够的通道数。
输入张量的通道数: 输入张量的通道数必须是上采样因子的平方倍数。例如，如果上采样因子为 3，则输入张量的通道数应为 9 的倍数。

注意事项

内存消耗: 上采样因子较大时，输出张量的大小会显著增加，这可能会导致更高的内存消耗。
输入和输出形状: 确保输入张量的形状符合要求，以避免运行时错误。

参数

upscale_factor (int): 用于提高空间分辨率的因子。

示例代码

import torch
import torch.nn as nn

# 初始化 PixelShuffle 模块
pixel_shuffle = nn.PixelShuffle(3)

# 创建一个随机张量作为输入
# 输入张量的形状为 (批大小, 通道数, 高, 宽)
# 通道数必须是上采样因子的平方倍数，这里为 3^2 = 9
input = torch.randn(1, 9, 4, 4)

# 应用 PixelShuffle
output = pixel_shuffle(input)

# 输出张量的形状
print(output.size())

这段代码首先创建了一个 PixelShuffle 模块，上采样因子设置为 3。然后，创建一个形状为 (1, 9, 4, 4) 的输入张量，并将其传递给 PixelShuffle 模块。输出的张量形状会变为 (1, 1, 12, 12)，即分辨率提高了。

nn.PixelUnshuffle

torch.nn.PixelUnshuffle 是 PyTorch 深度学习框架中的一个子模块，它执行 PixelShuffle 的逆操作。PixelUnshuffle 通过重新排列输入张量的元素，从而降低图像的分辨率。这个模块在一些特定的图像处理任务中非常有用，特别是当需要降采样图像时。

用法与用途

用法: PixelUnshuffle 接收一个输入张量，并按照指定的下采样因子（downscale factor）重新排列张量中的元素，以降低图像的分辨率。
用途: 它主要用于图像处理中的降采样任务，如在超分辨率网络中的特征图降采样，或在处理过大图像时减少计算负担。

使用技巧

选择合适的下采样因子: 下采样因子决定了图像分辨率的降低程度。因子越大，分辨率降低越明显。
输入张量的尺寸: 输入张量的高度和宽度必须是下采样因子的整数倍，以确保操作的平滑进行。

注意事项

内存消耗: 当下采样因子较大时，输出张量的通道数会显著增加，可能会导致内存消耗的增加。
输入和输出形状: 确保输入张量的尺寸符合要求，以避免运行时错误。

参数

downscale_factor (int): 用于降低空间分辨率的因子。

示例代码

import torch
import torch.nn as nn

# 初始化 PixelUnshuffle 模块
pixel_unshuffle = nn.PixelUnshuffle(3)

# 创建一个随机张量作为输入
# 输入张量的形状为 (批大小, 通道数, 高, 宽)
input = torch.randn(1, 1, 12, 12)

# 应用 PixelUnshuffle
output = pixel_unshuffle(input)

# 输出张量的形状
print(output.size())

这段代码首先创建了一个 PixelUnshuffle 模块，下采样因子设置为 3。然后，创建一个形状为 (1, 1, 12, 12) 的输入张量，并将其传递给 PixelUnshuffle 模块。输出的张量形状会变为 (1, 9, 4, 4)，即通道数增加，而空间分辨率降低了。

nn.Upsample

torch.nn.Upsample 是 PyTorch 中的一个子模块，用于对多通道的 1D（时间序列）、2D（空间）或 3D（体积）数据进行上采样（增加分辨率）。

用法与用途

用法: Upsample 可以增加数据的尺寸，例如将一个低分辨率的图像转换成高分辨率的图像。它可以处理 3D、4D 或 5D 的张量，分别对应于 1D、2D 和 3D 数据。
用途: 在图像处理、视频处理和医学成像等领域，Upsample 常用于图像超分辨率、放大图像或视频帧等任务。

使用技巧

选择合适的上采样模式: 根据数据类型和需求选择 nearest, linear, bilinear, bicubic 或 trilinear。
调整对齐角点: align_corners 参数控制角点像素的对齐方式。在使用 linear, bilinear, bicubic 和 trilinear 模式时，它会影响插值的结果。

注意事项

插值模式: 不同的插值模式适用于不同的应用场景。例如，nearest 通常用于类别标签，而 bilinear 更适用于图像。
大小和比例因子: 可以通过 size 或 scale_factor 指定输出的尺寸，但不能同时指定两者，因为这会引起歧义。

参数

size (int or Tuple[int]): 输出的空间尺寸。
scale_factor (float or Tuple[float]): 空间尺寸的乘数。
mode (str): 上采样算法，包括 'nearest', 'linear', 'bilinear', 'bicubic', 'trilinear'。
align_corners (bool): 控制角点像素的对齐方式。
recompute_scale_factor (bool): 重新计算用于插值计算的比例因子。

示例代码

import torch
import torch.nn as nn

# 创建一个 2x2 的输入张量
input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)

# 初始化 Upsample 模块，上采样因子为 2，使用最近邻插值
m = nn.Upsample(scale_factor=2, mode='nearest')
output_nearest = m(input)

# 初始化 Upsample 模块，上采样因子为 2，使用双线性插值
m = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=False)
output_bilinear = m(input)

# 输出结果
print("Nearest neighbor upsampling:\n", output_nearest)
print("\nBilinear upsampling:\n", output_bilinear)

这段代码展示了如何使用 Upsample 来对一个小张量进行上采样，分别使用最近邻和双线性插值。这可以在图像放大等场景中被应用。

nn.UpsamplingNearest2d

torch.nn.UpsamplingNearest2d 是 PyTorch 中的一个子模块，专门用于对 2D 数据（如图像）应用最近邻上采样。这种类型的上采样通过复制邻近的像素值来增加图像的尺寸，从而提高图像的分辨率。

用法与用途

用法: 可以通过指定目标输出尺寸（size）或上采样因子（scale_factor）来使用此模块。
用途: 主要用于图像放大，特别是在需要保持像素值不变的场景中，如在某些类型的图像生成任务中。

使用技巧

选择尺寸或比例因子: 根据需求选择提供输出尺寸还是上采样比例因子。比例因子会根据输入尺寸按给定比例放大图像，而指定尺寸可以直接设定输出图像的维度。
应用场景: 由于最近邻上采样可能会导致图像出现锯齿状边缘，它更适用于那些对图像锐度要求不高的应用。

注意事项

已弃用: UpsamplingNearest2d 已在较新版本的 PyTorch 中弃用，建议改用 torch.nn.functional.interpolate() 方法。

参数

size (int or Tuple[int, int], optional): 输出的空间尺寸。
scale_factor (float or Tuple[float, float], optional): 空间尺寸的乘数。

形状（同上）

示例代码

import torch
import torch.nn as nn

# 创建一个 2x2 的输入张量
input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)

# 初始化 UpsamplingNearest2d 模块，上采样因子为 2
m = nn.UpsamplingNearest2d(scale_factor=2)
output = m(input)

# 输出结果
print("Nearest neighbor upsampling:\n", output)

这段代码展示了如何使用 UpsamplingNearest2d 对一个小张量进行最近邻上采样。这种上采样方法简单但可能导致像素化的视觉效果。

nn.UpsamplingBilinear2d

torch.nn.UpsamplingBilinear2d 是 PyTorch 深度学习框架中的一个子模块，用于将输入信号（由多个输入通道组成）应用 2D 双线性上采样。这个模块在图像处理中非常有用，特别是在需要放大图像并保持图像内容平滑时。

用法与用途

用法: 可以通过指定 size（输出图像的尺寸）或 scale_factor（空间尺寸的乘数）来使用 UpsamplingBilinear2d。
用途: 在图像处理领域，这个模块通常用于放大图像尺寸，同时尽量保持图像内容的平滑性。它在一些图像超分辨率任务中非常有用。

使用技巧

选择尺寸或比例因子: 根据具体需求选择设置 size 或 scale_factor。size 直接指定输出图像的高度和宽度，而 scale_factor 指定相对于原始尺寸的放大比例。
双线性插值: 这种方法通过考虑相邻像素值的加权平均来计算新像素点，因此在放大图像时能够保持较好的图像平滑度。

注意事项

已废弃: 请注意，UpsamplingBilinear2d 类在最新版本的 PyTorch 中已被废弃，推荐使用 torch.nn.functional.interpolate(..., mode='bilinear', align_corners=True) 方法进行上采样。
使用替代方法: 虽然已废弃，但了解其原理对于理解图像处理中的双线性插值是有帮助的。

参数

size (int or Tuple[int, int], optional): 输出空间尺寸。
scale_factor (float or Tuple[float, float], optional): 空间尺寸的乘数。

示例代码

import torch
import torch.nn as nn

# 创建一个 2x2 的输入张量
input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)

# 初始化 UpsamplingBilinear2d 模块，上采样因子为 2
m = nn.UpsamplingBilinear2d(scale_factor=2)
output = m(input)

# 输出结果
print("Bilinear upsampling:\n", output)

这段代码展示了如何使用 UpsamplingBilinear2d 对一个小张量进行双线性上采样。这种上采样方法能够在放大图像时保持更好的图像质量，避免像素化的视觉效果。

总结

这篇博客深入探讨了 PyTorch 深度学习框架中的几个关键的图像上采样和下采样子模块，包括 nn.PixelShuffle, nn.PixelUnshuffle, nn.Upsample, nn.UpsamplingNearest2d, 和 nn.UpsamplingBilinear2d。每个模块的用法、用途、关键技巧和注意事项都进行了详细的说明。PixelShuffle 和 PixelUnshuffle 分别用于图像的超分辨率提升和降采样处理，而 Upsample 提供了多种上采样方法，包括最近邻和双线性插值等。UpsamplingNearest2d 和 UpsamplingBilinear2d 则专注于 2D 图像的最近邻和双线性上采样。

E寻数据

关注

23
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
0
评论
零基础也可以探索 PyTorch 中的上采样与下采样技术

这篇博客深入探讨了 PyTorch 深度学习框架中的几个关键的图像上采样和下采样子模块，包括, 和。每个模块的用法、用途、关键技巧和注意事项都进行了详细的说明。和分别用于图像的超分辨率提升和降采样处理，而Upsample提供了多种上采样方法，包括最近邻和双线性插值等。和则专注于 2D 图像的最近邻和双线性上采样。
复制链接

扫一扫