Transforms在pytorch中的一些使用

目录

摘要

1、Tensorboard的使用

2、 Transforms的使用

3、常见的Transforms

总结


摘要

此次是对Pytorch的学习,对于TensorBoard和Transforms的使用和一些方法有了初步的认识,transforms在图象变换中常常发挥着重要的作用。

1、Tensorboard的使用

TensorBoard 是一组用于数据可视化的工具。主要作用:

1、可视化模型的网络架构

2、检查机器学习工作流程中权重、偏差和其他组件的直方图

3、显示除表格数据外的一些内容,即文本、音频。

add_scalar的使用

from tensorboardX import SummaryWriter
​
writer = SummaryWriter("logs")
​
#writer.add_image()
​
#y = x
for i in range(100):
    writer.add_scalar("y=2x", 2*i, i)  #添加标量数据到summary中, 前者是x轴坐标的值(step),后者为y轴坐标的值(value)
​
writer.close()

通过命令行启动图像,在成功启动后,可以看到图像的模样。

tensorboard --logdir=logs --port=6007

 add_image的使用(常用于观察训练结果)

此函数要求的图片数据应当是torch或者numpy型。

利用Opencv读取图片,获得numpy型图片数据或者利用numpy.array(),对PIL图片进行转换。

转换图片的过程

from tensorboardX import SummaryWriter
from PIL import Image
import numpy as np
​
​
writer = SummaryWriter("logs")
image_path = "data/train/ants_image/0013035.jpg"
img  = Image.open(image_path)
img_array = np.array(img)
​
writer.add_image("test", img_array, 1, dataformats='HWC')    
writer.close()

在TensorBoard中生成的图片

打开TensorBoard的命令行:tensorboard --logdir=logs --port=6007

 

从PIL到numpy,需要在add_image()中指定shape中每一个数字/维表示的含义。

当需要多张图片单独显示的时候,只需要将抬头重新命名即可。

2、 Transforms的使用

python的用法-->tensor数据类型 通过transforms .ToTensor去看两个问题

1、transforms该如何使用(python)

from PIL import Image
from torchvision import transforms
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
​
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img)
​
print(tensor_img)

输出后转为tensor的结果

 对于transform在python中的使用结构图如下所示。

为什么我们需要Tensor数据类型

答:Tensor数据类型包装了神经网络所需要理论基础的参数。

3、常见的Transforms

1、Normalize的使用

计算公式:output[channel] = (input[channel] - mean[channel]) / std[channel]

from PIL import Image
from tensorboardX import SummaryWriter
from torchvision import  transforms
​
​
img = Image.open("test.jpg")
writer = SummaryWriter("log1")
print(img)
​
#ToTensor
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)
writer.add_image("ToTensor", img_tensor)
​
#Normalize
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize",img_norm)
​
writer.close()

按所举例子来说,result=(input-0.5)/0.5

最后程序输出的结果符合理论运算

 

在图片经过归一化层的变化后和原本的图片相比,产生了不同的效果。

 

2、Resize的使用(对图片进行缩放)

先通过Resize对图片进行放大,再转化为tensor格式输出

print(img.size)
trans_resize = transforms.Resize((512,512))
#img PIL ->resize ->img_resize PIL
img_resize= trans_resize(img)
#img_resize PIL ->totensor ->img_resize tensor
img_resize = trans_totensor(img_resize)
writer.add_image("Resize",img_resize)
print(img_resize)

明显可以看出图片经过了放大。

 

3、Compose的用法

Compose()中的参数需要是一个列表Python中,列表的表示形式为[数据1,数据2,...]在Compose中,数据需要是transforms类型所以得到,Compose([transforms参数1, transforms参数2....)

#Compase -resize -2
trans_resize_2 = transforms.Resize(512)
trans_compase = transforms.Compose([trans_resize_2,trans_totensor])
img_resize_2 = trans_compase(img)
writer.add_image("Resize",img_resize_2,1)

变换后的图片

RandomCrop(随机裁剪)

在图片上随机裁剪指定像素大小的图片

#RandomCrop
trans_random = transforms.RandomCrop(100)
trans_compase_2 = transforms.Compose([trans_random, trans_totensor])
for i in range(10):
    img_crop = trans_compase_2(img)
    writer.add_image("RandomCrop",img_crop,i)

裁剪后的结果:

总结

在transforms中应当关注输入和输出类型,其中的一些方法对于数据类型有着严格的要求,官方文档是最直接能解释这些方法的,因此对于英语的学习也比较重要。除此之外对于方法需要什么参数,需要几个参数需要注意起来。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值