目录
transform的各个方法(适用于PIL Image和 Tensor):
Transforms是常用的图像变换。可以使用Compose将它们连接起来,构成预处理的pipline。另外,torchvision.transforms.functional模块可以实现更多的图像变换,如果你想构建一个更加复杂的pipline(通常用于分割任务),这将会非常有用。
变换的输入可以是 PIL Image, Tensor Image 或者 batch of Tensor Image。
Tensor Image是一个形状为(C, H, W)的Tensor,其中C表示图像的通道数,H,W表示图像的高和宽。
batch of Tensor Image是一个形状为(B, C, H, W)的Tensor,其中B表示batch中的图像数。
应用于batch of Tensor Image的确定性或者随机变换同等处理batch中的所有图像。
注意:从v0.8.0开始,所有的随机变换使用torch默认的随机数生成器,使用者应该按照下面的方式设置随机种子。
# Previous versions
# import random
# random.seed(12)
# Now
import torch
torch.manual_seed(17)
Compose的使用
CLASS torchvision.transforms.Compose(transforms)
将几个变换组合在一起,这个变换不支持torchscript。其中,参数transforms(list of Transform objects)
Example:
>>> transforms.Compose([
>>> transforms.CenterCrop(10),
>>> transforms.ToTensor(),
>>> ])
transform的各个方法(适用于PIL Image和 Tensor):
1.裁剪
1.1 中心裁剪 (CenterCrop)
CLASS torchvision.transforms.CenterCrop(size)
功能解读:在中心裁剪给定的PIL Image或Tensor, size可取{ sequence 或 int } ,取int时,返回(int, int)大小的图片,取sequence时,返回(H,W)大小的图片。
Example:
import torch
import torchvision
import matplotlib.pyplot as plt
from PIL import Image
import pdb
import random
torch.manual_seed(17)
random.seed(12)
img = Image.open("image_00001.jpg")
plt.figure()
plt.subplot(1,2,1)
plt.imshow(img)
T = torchvision.transforms.CenterCrop(size=112)
img1 = T(img)
plt.subplot(1,2,2)
plt.imshow(img1)
plt.show()
效果:
1.2 5个裁剪
CLASS torchvision.transforms.FiveCrop(size)
1.3 10个裁剪
CLASS torchvision.transforms.TenCrop(size, vertical_flip=False)
1.4 随机裁剪
CLASS torchvision.transforms.RandomCrop(size, padding=None, pad_if_needed=False, fill=0, padding_mode='constant')
2. 翻转和旋转
2.1 随机水平翻转
CLASS torchvision.transforms.RandomHorizontalFlip(p=0.5)
官网文档链接: