Pytorch深度学习_Transforms的使用

听歌睡觉~

已于 2024-05-20 22:43:22 修改

阅读量679

点赞数 26

分类专栏： Pytorch深度学习文章标签：深度学习 pytorch 人工智能

于 2024-05-20 21:46:13 首次发布

本文链接：https://blog.csdn.net/DonG333_/article/details/139067143

版权

Pytorch深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在深度学习和计算机视觉中，Transforms 是一个用于图像预处理的库，它通常与数据加载库一起使用，比如 PyTorch 的 torchvision 库。Transforms 能够让你对图像数据进行各种操作，如调整大小、裁剪、归一化等，这对于训练机器学习模型来说非常重要。

问题一：我们应该如何使用Transforms？

下面是transforms结构及用法的示意图

以下是一些常用的 Transforms 工具及其功能：

调整大小:
- Resize(size): 将图像调整到指定的大小。
- Scale(size): 缩放图像到指定的大小。
裁剪:
- Crop(size): 在中心裁剪图像到指定大小。
- RandomCrop(size): 随机裁剪图像到指定大小。
- CenterCrop(size): 在图像中心裁剪出指定大小的区域。
翻转和旋转:
- RandomHorizontalFlip(): 随机水平翻转图像。
- RandomVerticalFlip(): 随机垂直翻转图像。
- RandomRotation(degrees): 随机旋转图像指定的角度。
颜色调整:
- ColorJitter(brightness, contrast, saturation, hue): 随机变化图像的亮度、对比度、饱和度和色调。
仿射变换:
- RandomAffine(degrees, translate, scale, shear): 对图像进行随机仿射变换。
滤波:
- GaussianBlur(): 对图像应用高斯模糊。
转换为张量:
- ToTensor(): 将 PIL 图像或 Numpy 数组转换为 FloatTensor，并将数值范围从 [0, 255] 转换到 [0.0, 1.0]。
归一化:
- Normalize(mean, std): 使用均值和标准差对图像进行归一化。
Lambda 函数:
- Lambda(lambd): 应用一个 lambda 函数作为转换。
组合转换:
- Compose(): 组合多个转换操作，按顺序执行。
其他:
- Grayscale(): 将图像转换为灰度。
- RandomGrayscale(p): 以概率 p 将图像转换为灰度。
- RandomErasing(): 随机擦除图像的一部分。
- Pad(padding): 填充图像边缘。

实战使用示例：

#导入Python Imaging Library (PIL)库，这是Python中处理图像的主要库之一。
from PIL import Image 
#导入PyTorch库中的TensorBoard SummaryWriter类。
# TensorBoard是TensorFlow的可视化工具，而PyTorch提供了一个接口可以使其与TensorBoard兼容。SummaryWriter类是这个接口的一部分，可以将信息写入TensorBoard可以读取的日志中。
from torch.utils.tensorboard import SummaryWriter
# 导入PyTorch的视觉库中的transforms模块。transforms模块提供了许多常见的图像转换，例如裁剪、旋转、缩放等。
from torchvision import transforms


# 定义要打开的图像的路径
img_path = "E:\program1-Classified Protection Assessment\data_set\hymenoptera_data\val\ants\800px-Meat_eater_ant_qeen_excavating_hole.jpg"
# 使用PIL库打开图像
img = Image.open(img_path)
# 创建一个SummaryWriter对象，并指定日志将被写入的目录（在这里是"logs"目录）。
writer = SummaryWriter("logs")


# 创建一个转换对象，用于将PIL图像或NumPy ndarray转换为PyTorch张量
tensor_trans = transforms.ToTensor()
# 使用上述转换对象将图像转换为张量
tensor_img = tensor_trans(img)


# 使用SummaryWriter对象的add_image方法将图像张量添加到日志中。"Tensor_img"是图像的标签，tensor_img是要添加的图像张量。
writer.add_image("Tensor_img",tensor_img)
# 关闭SummaryWriter对象。
writer.close(),writer.close()

之后我们在pycharm终端中输入：