PyTorch(一) torchvision(部分) 理解

torchvision

torchvision作用:torchvision包 包含了目前流行的数据集,模型结构,和常用的图片转换工具。


一. torchvision.datasets

torchvision.datasets包含如下的数据集(其中ImageFolder不是数据集):

  • MNIST
  • COCO(用于图像标注和目标检测)
  • LSUN
  • ImageFolder(一个通用的数据加载器, 加载自定义数据集时可以使用该类)

1. torchvision.datasets.ImageFolder(root, transform=None, target_transform=None, loader=, is_valid_file=None)参数

  • root:数据集的根目录
  • transform:对图片进行处理的一个参数(函数),原始图片作为输入,处理后的图片作为输出
  • target_transform:对标签(label)进行处理的一个参数(函数),原始标签(label)作为输入,处理后的标签作为输出
  • loader:数据集的加载方式,默认即可
  • is_valid_file:获取图像文件的路径并检查该文件是否为有效文件的参数(用于检查文件是否损坏)

2. torchvision.datasets.ImageFolder()的三个属性:

  • self.classes:用一个list保存类别名称
  • self.class_to_idx:类别对应的索引,与不做不做变换的标签(label)对应
  • self.imgs:保存(img_path, class)tuple的list

二、torchvision.transforms

torchvision.transforms作用:是对图片(PIL.Image类型)进行变换,即数据增强。
torchvision.transforms.Compose()函数可以将不同的变换(transform)组合起来,形成transforms

1. 常用的图像变换


裁剪——Crop功能
中心裁剪:transforms.CenterCrop(size) size可以为整数数或者一个tuple依据给定的size从中心裁剪
随机裁剪:transforms.RandomCrop(size, padding=0)依据给定的size随机裁剪
随机长宽比裁剪: transforms.RandomResizedCrop(size)随机大小,随机长宽比裁剪原始图片,最后将图片resize到设定好的size
上下左右中心裁剪: transforms.FiveCrop(size)对图片进行上下左右以及中心裁剪,获得5张图片,返回一个4D-tensor
上下左右中心裁剪后翻转: transforms.TenCrop(size, vertical_flip=False)对图片进行上下左右以及中心裁剪,然后全部翻转(水平或者垂直),获得10张图片,返回一个4D-tensor

翻转和旋转——Flip and Rotation功能参数
依概率P水平翻转:transforms.RandomHorizontalFlip§依据概率p对PIL图片进行水平翻转
依概率P垂直翻转:transforms.RandomVerticalFlip§依据概率p对PIL图片进行垂直翻转
随机翻转: transforms.RandomRotation(degrees, resample=False, expand=False, center=None)依degrees随机旋转一定角度1、degress- (sequence or float or int) ,若为单个数,如 30,则表示在(-30,+30)之间随机旋转若为sequence,如(30,60),则表示在30-60度之间随机旋转

图像变换功能参数
resize:transforms.Resize(size, interpolation=2)重置图像分辨率
标准化:transform.Normalize(mean, std)对数据按通道进行标准化,即先减均值,再除以标准差,注意是 hwc
转换为Tensor, 并归一化至[0, 1]:transforms.Tensor()将PIL Image或者 ndarray 转换为tensor,并且归一化至[0-1];注意事项:归一化至[0-1]是直接除以255,若自己的ndarray数据尺度有变化,则需要自行修改
填充:transforms.Pad(padding, fill=0, padding_mode=‘constant’)对图像进行填充
修改亮度、对比度和饱和度:transforms.ColorJitter(brightness=0, contrast=0, saturation=0, hue=0)修改修改亮度、对比度和饱和度
转灰度图:transforms.Grayscale(num_output_channels=1)将图片转换为灰度图um_output_channels- (int) ,当为1时,正常的灰度图,当为3时, 3 channel with r == g == b
线性变换:transforms.LinearTransformation(transformation_matrix)对矩阵做线性变化,可用于白化处理
仿射变换:transforms.RandomAffine(degrees, translate=None, scale=None, shear=None, resample=False, fillcolor=0)
依概率p转为灰度图:transforms.RandomGrayscale§依概率p将图片转换为灰度图,若通道数为3,则3 channel with r == g == b
将数据转换为PILImage:transforms.ToPILImage(mode=None)mode- 为None时,为1通道, mode=3通道默认转换为RGB,4通道默认转换为RGBA

对transforms操作,使数据增强更灵活功能
transforms.RandomChoice(transforms)从给定的一系列transforms中选一个进行操作
transforms.RandomApply(transforms, p=0.5)给一个transform加上概率,依概率进行操作
transforms.RandomOrder将transforms中的操作随机打乱

#参考
PyTorch模型训练实用教程

PtTorch中文文档

PyTorch 学习笔记:transforms的二十二个方法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

West_East

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值