系列文章目录
- pytorch学习1-数据加载以及Tensorboard可视化工具
- pytorch学习2-Transforms主要方法使用
- pytorch学习3-torchvisin和Dataloader的使用
- pytorch学习4-简易卷积实现
- pytorch学习5-最大池化层的使用
- pytorch学习6-非线性变换(ReLU和sigmoid)
- pytorch学习7-序列模型搭建
- pytorch学习8-损失函数与反向传播
- pytorch学习9-优化器学习
- pytorch学习10-网络模型的保存和加载
- pytorch学习11-完整的模型训练过程
一、图像数据转换
# 下面代码实现了图像数据类型转换以及使用
img_path= "dataset/hymenoptera_data/train/ants/0013035.jpg"
img=Image.open(img_path)#这个时候,图片是pil类型的
transforms_ToTensor=transforms.ToTensor()#生成了一个类型转换对象
img=transforms_ToTensor(img)#转换为了tensor类型
# #上面两行,也等价于这一行:img=transforms.ToTensor()(img)
二、归一化
#Normalize(归一化)的使用
print(img[0][0][0])
trans_norm=transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm=trans_norm(img)#主要功能是,对图像进行归一标准化(均值mean变为0,标准差std变为1),加速模型训练。输出=(输入-各通道均值)/各通道标准差
print(img_norm[0][0][0])
writer.add_image("我是标题2",img_norm)
writer.close()
#Normalize(归一化)的使用
三、缩放
#Resize(缩放)的使用
toPIL_img=transforms.ToPILImage()#Resize方法要求pil图像类型
img=toPIL_img(img)#Resize方法要求pil图像类型
print(img.size)
trans_resize=transforms.Resize((512,512))
img_resize=trans_resize(img)
print(img_resize.size)
img_resize=transforms_ToTensor(img_resize)
writer.add_image("我是标题3",img_resize,3)
writer.close()
#Resize(缩放)的使用
四、Compose的使用
#Compose的使用,作用是产生一个操作序列,其中,参数类型需要是transforms类型,并且上一次参数的输出是下一个的输入
toPIL_img=transforms.ToPILImage()#Resize方法要求pil图像类型
img=toPIL_img(img)#Resize方法要求pil图像类型
trans_resize2=transforms.Resize((100,100))
trans_compose=transforms.Compose(
[trans_resize2,
transforms_ToTensor]
)
img_size2=trans_compose(img)
writer.add_image("我是标题四",img_size2,4)
writer.close()
#Compose的使用,作用是产生一个操作序列,其中,参数类型需要是transforms类型,并且上一次参数的输出是下一个的输入
五、RandomCrop随机裁剪
toPIL_img=transforms.ToPILImage()#Resize方法要求pil图像类型
img=toPIL_img(img)#Resize方法要求pil图像类型
trans_random=transforms.RandomCrop(512)#随机裁剪后的大小,单个int值会裁剪成方形
trans_compose2=transforms.Compose(
[trans_random,
transforms_ToTensor]
)
for i in range(10):#随机裁剪十次
img_crop=trans_compose2(img)
writer.add_image("我是标题⑤",img_crop,i)
writer.close()
总结
以上就是今天要讲的内容,Transforms的主要方法使用