PyTorch入门学习（四）：常见的Transforms使用

不吃花椒的兔酱

已于 2023-10-24 18:53:53 修改

阅读量755

点赞数 19

分类专栏： PyTorch 文章标签： pytorch 学习深度学习 1024程序员节

于 2023-10-23 18:29:40 首次发布

本文链接：https://blog.csdn.net/qq_46179411/article/details/133995953

版权

PyTorch 专栏收录该内容

20 篇文章 6 订阅

订阅专栏

一、引言

在深度学习项目中，通常需要处理各种类型的数据。数据预处理是确保数据适合于模型训练的关键步骤之一。PyTorch提供了Transforms模块，用于灵活地对数据进行转换和增强，以满足模型的需求。下面，将学习如何使用常见的Transforms操作。

二、ToTensor

ToTensor是一个常用的Transforms，它将图像数据从PIL格式转换为Tensor格式，这是深度学习模型常用的数据类型。

trans_tensor = transforms.ToTensor()
img_tensor = trans_tensor(img)

这个操作可以将图像数据转换为PyTorch张量，从而可以直接用于神经网络的输入。

三、Normalize

Normalize用于对张量进行归一化操作，将数据缩放到特定的均值和标准差范围内，以便于模型的训练和收敛。

trans_norm = transforms.Normalize([0.1, 0.1, 0.1], [1, 1, 1])
img_norm = trans_norm(img_tensor)

在上述示例中，将图像张量的每个通道的均值设置为0.1，标准差设置为1。这有助于模型更快地学习数据的特征。

四、Resize

Resize操作用于调整图像的大小，以便于模型的输入。注意，Resize操作的输入必须是PIL格式的图像。

trans_size = transforms.Resize((128, 128))
img_resize = trans_size(img)

在示例中，将图像的大小调整为128x128像素，以满足模型的输入要求。

五、RandomCrop

RandomCrop操作用于随机裁剪图像，以进行数据增强。在训练深度学习模型时，这种数据增强可以增加模型的鲁棒性。

trans_random = transforms.RandomCrop(200, 200)
trans_compose_2 = transforms.Compose([trans_random, trans_tensor])

在示例中，使用RandomCrop随机裁剪图像，然后将其转换为张量，以进行多次数据增强。

完整代码如下：

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

# 创建一个TensorBoard写入器，将日志保存到名为"logs"的文件夹
writer = SummaryWriter("logs")

# 从文件路径加载图像
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)

# ToTensor
# 将图像转换为PyTorch张量
trans_tensor = transforms.ToTensor()
img_tensor = trans_tensor(img)
writer.add_image("ToTensor", img_tensor)

# Normalize
# 将张量数据进行归一化，均值设置为[0.1, 0.1, 0.1]，标准差设置为[1, 1, 1]
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.1, 0.1, 0.1], [1, 1, 1])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize", img_norm, 3)

# Resize
# 调整图像大小为(128, 128)像素
print(img.size)
trans_size = transforms.Resize((128, 128))
img_resize = trans_size(img)
img_resize = trans_tensor(img_resize)
writer.add_image("Resize", img_resize, 0)
print(img_resize)

# Compose - Resize - ToTensor
"""
Compose允许将多个Transforms操作组合在一起，以便一次性对图像执行多个操作。
传入的参数必须是一个Transforms操作的列表，按照从左到右的顺序执行。
前一个操作的输出类型必须与后一个操作的输入类型匹配。
"""
tran_resize_2 = transforms.Resize(128)
trans_compose = transforms.Compose([tran_resize_2, trans_tensor])
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 1)

# RandomCrop
# 随机裁剪图像，用于数据增强
trans_random = transforms.RandomCrop(200, 200)
trans_compose_2 = transforms.Compose([trans_random, trans_tensor])

# 多次随机裁剪图像并添加到TensorBoard
for i in range(10):
    img_crop = trans_compose_2(img)
    writer.add_image("RandomCrop", img_crop, i)

# 关闭TensorBoard写入器
writer.close()

参考资料：

视频教程：PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】

不吃花椒的兔酱

关注

19
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
PyTorch入门学习（四）：常见的Transforms使用

在深度学习项目中，通常需要处理各种类型的数据。ToTensor是一个常用的Transforms，它将图像数据从PIL格式转换为Tensor格式，这是深度学习模型常用的数据类型。Normalize用于对张量进行归一化操作，将数据缩放到特定的均值和标准差范围内，以便于模型的训练和收敛。在上述示例中，将图像张量的每个通道的均值设置为0.1，标准差设置为1。在示例中，使用RandomCrop随机裁剪图像，然后将其转换为张量，以进行多次数据增强。在示例中，将图像的大小调整为128x128像素，以满足模型的输入要求。
复制链接

扫一扫