torchvision.transforms模块功能介绍

torchvision.transforms模块介绍

torchvision.transforms模块是PyTorch进行图片预处理的模块。

一、 图片数据读取

对图像进行处理的第一步就是读取图片。一般来说,图片读入后以numpy.ndarray格式和PILImage方式。这里简单介绍几种图片的读取方式。
请添加图片描述

1. PIL读取和显示图片

PIL通过Image模块读入图片。

from PIL import Image

dir_path = r"C:\Users\用户名\Pictures\test.jpg"
img_plt = Image.open(dir_path)
>>>print(img_plt)
output: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=4000x2250 at 0x20319DB3240>
>>>plt.imshow(img_plt)

在这里插入图片描述

2. matplotlib.pyplot读取图片

import matplotlib.pyplot as plt

dir_path = r"C:\Users\用户名\Pictures\test.jpg"
img_plt = plt.imread(dir_path)
>>>print(type(img_plt))
output: <class 'numpy.ndarray'>
>>>plt.imshow(img_plt)

在这里插入图片描述

二、对PIL.Image图像的变换

1. torchvision.transforms中对PIL.Image变换的类

  1. class torchvision.transforms.CenterCrop(size)
    将给定的 PIL.Image 进行中心切割,得到给定的size,size可以是tuple(target_height, target_width)。size也可以是Integer,这种情况下切出来的是正方形。size大小可以超过图片尺寸,
img_trans = transforms.CenterCrop((3000, 4000))(img_plt)
plt.imshow(img_trans)

在这里插入图片描述
2. class torchvision.transforms.RandomCrop(size, padding=0)
切割中心点的位置随机选取。size 可以是tuple也可以是Integer。size大小不能超过图片尺寸。

img_trans = transforms.RandomCrop((300, 400))(img_plt)
plt.imshow(img_trans)

在这里插入图片描述
3. class torchvision.transforms.RandomHorizontalFlip
随机水平翻转给定的PIL.Image,概率为0.5。即:一半的概率翻转,一半的概率不翻转。

img_trans = transforms.RandomHorizontalFlip(0.5)(img_plt)
plt.imshow(img_trans)

在这里插入图片描述
4. class torchvision.transforms.RandomSizedCrop(size, interpolation=2)
先将给定的 PIL.Image 随机切,然后再resize成给定的size大小。

img_trans = transforms.RandomSizedCrop((200, 300))(img_plt)
plt.imshow(img_trans)

在这里插入图片描述
5. class torchvision.transforms.Pad(padding, fill=0)
将给定的PIL.Image的所有边用给定的pad value填充。 padding:要填充多少像素 fill:用什么值填充.

img_trans = transforms.Pad(padding=50, fill=(150, 150, 0))(img_plt)
plt.imshow(img_trans)

在这里插入图片描述

三、 转换为Tensor

  1. class torchvision.transforms.ToTensor
    把一个取值范围是[0,255]的PIL.Image或者shape为(H,W,C)的numpy.ndarray,转换成形状为[C,H,W],取值范围是[0,1.0]的torch.FloadTensor
transforms.ToTensor()(img_trans)
output:tensor([[[0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         ...,
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882]],

        [[0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         ...,
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882],
         [0.5882, 0.5882, 0.5882,  ..., 0.5882, 0.5882, 0.5882]],

        [[0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
         [0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
         [0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
         ...,
         [0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
         [0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
         [0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000]]])

四、对Tensor进行变换

  1. class torchvision.transforms.Normalize(mean, std)
    给定均值:(R,G,B) 方差:(R,G,B),将会把Tensor正则化。即:Normalized_image=(image-mean)/std。
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值