pytorch学习2-Transforms主要方法使用

Magic171

已于 2023-12-05 11:28:27 修改

阅读量78

点赞数

分类专栏：吴恩达机器学习文章标签： pytorch 学习人工智能

于 2023-12-05 10:59:58 首次发布

本文链接：https://blog.csdn.net/magic171/article/details/134801865

版权

吴恩达机器学习专栏收录该内容

22 篇文章 1 订阅

订阅专栏

本文详细介绍了在PyTorch中使用各种数据预处理技术，如ToTensor转换、归一化、Resize缩放、Compose操作序列和RandomCrop随机裁剪，以及如何在Tensorboard中可视化这些过程。

摘要由CSDN通过智能技术生成

系列文章目录

一、图像数据转换

# 下面代码实现了图像数据类型转换以及使用
img_path= "dataset/hymenoptera_data/train/ants/0013035.jpg"
img=Image.open(img_path)#这个时候，图片是pil类型的

transforms_ToTensor=transforms.ToTensor()#生成了一个类型转换对象
img=transforms_ToTensor(img)#转换为了tensor类型
# #上面两行，也等价于这一行：img=transforms.ToTensor()(img)

二、归一化

#Normalize(归一化)的使用
print(img[0][0][0])
trans_norm=transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm=trans_norm(img)#主要功能是，对图像进行归一标准化（均值mean变为0，标准差std变为1），加速模型训练。输出=（输入-各通道均值）/各通道标准差
print(img_norm[0][0][0])
writer.add_image("我是标题2",img_norm)
writer.close()
#Normalize(归一化)的使用

三、缩放

#Resize(缩放)的使用
toPIL_img=transforms.ToPILImage()#Resize方法要求pil图像类型
img=toPIL_img(img)#Resize方法要求pil图像类型
print(img.size)

trans_resize=transforms.Resize((512,512))
img_resize=trans_resize(img)
print(img_resize.size)

img_resize=transforms_ToTensor(img_resize)
writer.add_image("我是标题3",img_resize,3)
writer.close()
#Resize(缩放)的使用

四、Compose的使用

#Compose的使用，作用是产生一个操作序列,其中，参数类型需要是transforms类型,并且上一次参数的输出是下一个的输入
toPIL_img=transforms.ToPILImage()#Resize方法要求pil图像类型
img=toPIL_img(img)#Resize方法要求pil图像类型
trans_resize2=transforms.Resize((100,100))

trans_compose=transforms.Compose(
    [trans_resize2,
     transforms_ToTensor]
)
img_size2=trans_compose(img)

writer.add_image("我是标题四",img_size2,4)
writer.close()
#Compose的使用，作用是产生一个操作序列,其中，参数类型需要是transforms类型,并且上一次参数的输出是下一个的输入

五、RandomCrop随机裁剪

toPIL_img=transforms.ToPILImage()#Resize方法要求pil图像类型
img=toPIL_img(img)#Resize方法要求pil图像类型

trans_random=transforms.RandomCrop(512)#随机裁剪后的大小，单个int值会裁剪成方形
trans_compose2=transforms.Compose(
    [trans_random,
     transforms_ToTensor]
)
for i in range(10):#随机裁剪十次
    img_crop=trans_compose2(img)
    writer.add_image("我是标题⑤",img_crop,i)
writer.close()