torchvision-transforms 常用函数总结

torchvision-transforms 常用函数总结

一、概述——为何要用transforms

在这里插入图片描述
需求是多样的,因此可以通过实例化一个transforms,满足转换的需要。具体的class可以参考transforms.py中的描述

二、函数介绍

1、ToTensor

功能:将PIL.image读取的PIL类型图片或者cv2.imread读取的numpy.ndarray转化为tensor类型
最简单的函数,没什么参数,直接默认构造函数然后调用即可,具体如下:

from torchvision import transforms
from PIL import Image

if __name__ == '__main__':
    img_path = "data/hymenoptera_data/train/ants/5650366_e22b7e1065.jpg"
    img = Image.open(img_path)
    img2tensor = transforms.ToTensor()
    img_tensor = img2tensor(img)
    print(img_tensor)

2、Normalize

功能:输入RGB三通道的标准差和方差,输出正则化的图像矩阵

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image
import cv2

if __name__ == '__main__':
    img_path = "data/hymenoptera_data/train/ants/5650366_e22b7e1065.jpg"
    img = Image.open(img_path)
    img2tensor = transforms.ToTensor()
    img_tensor = img2tensor(img)
    writer = SummaryWriter("logs")
    writer.add_image("original", img_tensor)
    trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
    img_norm = trans_norm(img_tensor)
    writer.add_image("Normalize", img_norm)

    writer.close()

原图
在这里插入图片描述

正则化后的图像
在这里插入图片描述

3、Resize(非常常用)

功能
1、Resize([h, w])——对一个图像进行缩放,虽然会改变长宽比,但图像未发生裁剪,因此可以通过Resize再次还原回来
2、Resize(x) ——对短边缩放到x,长宽比不变

注意
PIL image 的size属性返回的是w, h而Resize参数顺序是h,w,切勿弄错

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image
import cv2

if __name__ == '__main__':
    img_path = "data/hymenoptera_data/train/ants/5650366_e22b7e1065.jpg"
    img = Image.open(img_path)
    writer = SummaryWriter("logs")
    trans_resize = transforms.Resize((512, 512))
    resized_img = trans_resize(img)
    img2tensor = transforms.ToTensor()
    img_tensor = img2tensor(resized_img)
    writer.add_image("resized", img_tensor)
    writer.close()

缩放后的结果
在这里插入图片描述

4、Compose

功能:组合变换,参数是各种变换组成的列表“[transform1, transform2, …]”

    trans_resize = transforms.Resize((512, 512))
    img2tensor = transforms.ToTensor()
    trans = transforms.Compose([trans_resize, img2tensor])
    img_tensor = trans(img)

5、RandomCrop

功能:随机裁剪,和Resize类似

from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image
import cv2

if __name__ == '__main__':
    img_path = "data/hymenoptera_data/train/ants/5650366_e22b7e1065.jpg"
    img = Image.open(img_path)
    writer = SummaryWriter("logs")
    trans_random_crop = transforms.RandomCrop((300, 400))
    img2tensor = transforms.ToTensor()
    trans = transforms.Compose([trans_random_crop, img2tensor])
    for i in range(5):
        img_tensor = trans(img)
        writer.add_image("random crop", img_tensor, i)
    writer.close()

三、transforms和数据集的结合使用

方法:先查看数据集里都有啥(调试),然后根据需求加transform

import torchvision
from PIL import Image
from torch.utils.tensorboard import SummaryWriter

trans = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor()
])
if __name__ == '__main__':

    train_set = torchvision.datasets.CIFAR10(root="./dataset", train=True, transform=trans, download=True)
    test_set = torchvision.datasets.CIFAR10(root="./dataset", train=False, transform=trans, download=True)

    print(test_set)
    img, target = test_set[1]
    writer = SummaryWriter("logs")
    writer.add_image("pic1", img, 1)
    print(test_set.classes[target])
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch中的transforms函数是一组用于对图像进行预处理和数据增强的函数的集合。这些函数可以按照指定的顺序组合,以便在训练和测试过程中对输入的图像数据进行处理。transforms.Compose函数可以将这些图像变换函数按照指定的顺序组合成一个整体的变换操作。 例如,可以使用transforms.RandomCrop函数在训练过程中对图像进行随机裁剪,transforms.RandomHorizontalFlip函数进行随机水平翻转,transforms.ToTensor函数将图像转换为张量等。这些函数可以按照需要的顺序进行组合,并在训练和测试数据上应用。 另外,还可以使用torch.nn.Sequential函数来实现相同的功能,将这些图像变换函数按照顺序放入Sequential中,然后逐个对输入的图像进行处理。这两种方式都可以实现对图像数据的处理和增强,具体选择哪种方式取决于个人的喜好和需求。 总之,PyTorch中的transforms函数提供了一组方便的图像变换和数据增强的函数,可以用于对训练和测试数据进行预处理,以提高模型的性能和准确率。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [pytorch中的transforms介绍](https://blog.csdn.net/qq_38406029/article/details/121967149)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值