transform中各类用法
1.ToTensor转换图片格式
transform是一个transform.py文件,里面包含多个类,其中包括ToTensor类,注意ToTensor是一个类,而不是一个方法,所有首先要创建一个对象,然后在用该对象将图片的PIL格式或是numpy格式转化为Tensor格式,代码如下:
from PIL import Image
from torchvision import transforms
img_path = "data/train/ants_image/0013035.jpg"
img_PIL = Image.open(img_path)
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img_PIL)
print(tensor_img)
上面代码是将PIL格式转化为Tensor格式,如果是要numpy格式的图片,除了之前用numpy.array强制将格式转化为numpy格式外,还可通过OpenCV中的cv2.imread函数直接获得numpy格式的图片,代码如下:
import cv2
cv2.imread(img_path)
2.Normalize图片标准化
Normalize类用于将输入的图片进行标准化,用法是创建对象=transform.Normaliz(n维平均值, n维标准差)其中的输入的第一个参数是图片的n维平均值,第二个参数是图片的n维方差,这里的n是指通道数,一般为3通道,即第一个参数是是一个包含三个数的一维数组,第一个数是第一通道下的平均值,第二个数是第二通道的平均值,第三个数是第三通道的平均值。代码如下:
print(img_tensor[0][0][0])
trans_nor = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]