transforms

transforms主要作用是对图片进行变换
在这里插入图片描述
可以使用PyCharm界面左侧的structure按钮查看transforms的结构:由许多类定义组成的模块。

1. transforms被如何使用(python)

在transforms中选择一个class,对它进行创建,根据创建的实例,查看需要的输入参数,最后返回结构。

from PIL import Image
from torchvision import transforms

img_path="data/train/ants_image/0013035.jpg"
img=Image.open(img_path)

tensor_trans=transforms.ToTensor()
tensor_img=tensor_trans(img)

print(tensor_img)

将图片类型转换tensor

在这里插入图片描述

在函数的引用括号里按Ctrl+P可以显示函数需要传入什么参数及参数类型(P代表parameter)

2. 为什么我们需要Tensor数据类型

  • 查看tensor数据类型的一些相关信息,可以理解为包含了神经网络理论基础的一些参数的数据类型。

用opencv读取ndarray类型的数据

import cv2

cv_img=cv2.imread(img_path)

在这里插入图片描述

小结:目前学过的3种打开图片并往SummaryWriter类传参的方式:

  • PIL.Image.open打开,np.array转换
  • PIL.Image.open打开,transforms.ToTensor转换
  • opencv打开(这个打开就是ndarray类型)

3.常见的Transforms

在这里插入图片描述

Python的内置函数中的__call__的用法:
在这里插入图片描述

  • Compose:组合transforms中的多个类(多个工具)

Python类的魔法方法,可以让实例接收参数并被调用

  • ToTensor:
    将PIL Image和numpy.ndarray类型转换为tensor类型
from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

writer =SummaryWriter("logs")
img=Image.open("images/90179376_abc234e5f4.jpg")
print(img)

#ToTensor
trans_totensor =transforms.ToTensor()
img_tensor = trans_totensor(img)
writer.add_image( "ToTensor", img_tensor)

writer.close()
  • Normalize:
    对图片进行归一化的变换,具体效果见代码,注意计算公式
    在这里插入图片描述
from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

writer =SummaryWriter("logs")
img=Image.open("images/90179376_abc234e5f4.jpg")
print(img)

#Normalize
print(img_tensor[0][0][0])
trans_norm=transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm=trans_norm(img_tensor)
print(img_norm[0][0][0])

writer.close()

在这里插入图片描述

  • Resize:
    作用是改变图片的尺寸,输入是PIL Image,输出同样是PIL Image。
    PyCharm小技巧:
    在这里插入图片描述
# Resize
print(img.size)
trans_resize = transforms.Resize((512, 512))
# img PIl>resize >img_resize PIl
img_resize = trans_resize(img)
# img_resize pIl ->totensro -> img_resize tensor
img_resize = trans_totensor(img_resize)
writer.add_image("Resize", img_resize)
print(img_resize)
  • Compose(使用):
    传入的参数是一个由transfroms这个模块中类的实例组成的列表。
#Compose
trans_resize_2=transforms.Resize(512)
# PIL ->PIL -> tensor
trans_compose=transforms.Compose([trans_resize_2,trans_totensor])
img_resize_2=trans_compose(img)
writer.add_image("Compose",img_resize_2,1)
  • RandomCrop:
    随机裁剪的尺寸大小不能小于图片的尺寸,否则会报错。

总结使用方法:

- 关注输入和输出类型
- 关注官方文档
- 关注方法需要什么参数
- 不知道返回值类型的时候可以试错或者搜索
	- print
	- print(type())
	- debug
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值