目录
1、torchvision
torchvision会包括我们经常处理图像一些库
(1) torchvision.tramsforms__可以用于图像预处理和数据增强(数据缩放、翻转等)
(2)torchvision.datasets__包括一些常见数据集(Fashion-MNIST、ImageNet、VOC等)
(3)torchvision.models__包括一些官方预训练模型权重(VGG、ResNet、Mobilenetv2等)
(4)torchvision.utils__提供一些可视化方法
(5)torchvision.io__视频、图像文件io操作
2、Transforms学习
2、1导入图像
import torch
import matplotlib.pyplot as plt
from torchvision.models import vgg11
from PIL import Image
import numpy as np
model = vgg11(pretrained=True)
img_path = 'C:/Users/CHDT/Desktop/cat.jpg'
img = Image.open(img_path).resize((224,224))
rgb_img = np.float32(img)/255
plt.imshow(img)
2.2 沿中心切割图像
#给定图片沿中心切割
img_centercrop1 = transforms.CenterCrop((500,500))(img)
print(img_centercrop1.size)
#对图片沿中心缩小切割,超出期望大小的部分剔除
img_centercrop2 = transforms.CenterCrop((224,224))(img)
print(img_centercrop2.size)
plt.subplot(1,3,1),plt.imshow(img),plt.title('Original')
plt.subplot(1,3,2),plt.imshow(img_centercrop1),plt.title('500*500')
plt.subplot(1,3,3),plt.imshow(img_centercrop2),plt.title('224*224')