PyTorch学习第四天

一、torchvision中的transforms

        作用:对图形进行变换,可以用来做数据增强

        注:通常情况下,PIL使用的颜色通道顺序是RGB,而opencv使用的是BGR       

(1)认识tensor数据类型

                作用:包装了反向神经网络所需要的一些理论基础的参数,数据要转换为tensor再训练

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

# python的用法 -》 tensor数据类型
# 通过transform.ToTensor去看两个问题

# 2、为什么我们需要tensor数据类型

# 绝对路径  G:\learn_pytorch\data\train\ants_image\0013035.jpg
# 相对路径  data/train/ants_image/0013035.jpg
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
# 打印出图片的类型、rgb模式、大小 print(img)

writer = SummaryWriter("logs")

# 1、transforms该如何使用
tensor_trans = transforms.ToTensor()
tensor_img = tensor_trans(img)
# print(tensor_img)

writer.add_image("Tensor_img", tensor_img)

writer.close()

(2)python中_call_的用法

                作用:能让对象像函数一样被调用,不需要‘.’就可读入参数被调用

class Person:
    def __call__(self, name):
        print("__call__" + "Hello " + name)

    def hello(self, name):
        print("hello" + name)


person = Person()
person("zhangsan")
# __call__Hello zhangsan
person.hello("lisi")
# hellolisi

(3)常见的Transforms使用

        学习方法:

                1. 关注输入和输出类型;2.多看官方文档;3.关注方法需要什么参数

        不知道返回值的时候: print();print(type()) 

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

writer = SummaryWriter("logs")
img = Image.open("images/67270775_e9fdf77e9d.jpg")
print(img)

# ToTensor
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img)
writer.add_image("ToTensor", img_tensor)

# Normalize  使不同维度之间的特征在数值上的量纲差不多,使梯度下降更快,更容易求解,加快训练速度
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])   #第一个参数是针对rgb每个通道的均值,第二个是标准差
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize", img_norm)

# Resize  输入是PIL  指定图片的高度和宽度
print(img.size)
trans_resize = transforms.Resize((512,512))
# img PIL -> resize -> img_resize PIL
img_resize = trans_resize(img)
# img_resize PIL -> totensor -> img_resize tensor
img_resize = trans_totensor(img_resize)
writer.add_image("Resize", img_resize, 0)
print(img_resize)

# Compose - resize - 2
# 作用:可以同时进行推片裁剪和类型转换,将多个变换组合在一起
# Compose()中的参数需要一个列表 python中列表的表示为[数据1,数据2,…]
# Compose中,数据需要transforms类型,因此得到Compose([transforms参数1,transforms参数2])
trans_resize_2 = transforms.Resize(1024)
# PIL -> PIL -> tensor
# trans_resize_2的输出做trans_totensor的输入,相当于先裁剪再转换为tensor
trans_compose = transforms.Compose([trans_resize_2, trans_totensor])
img_resize_2 = trans_compose(img)  #这里的img对应于trans_resize_2参数
writer.add_image("Resize", img_resize_2, 1)

# RandomCrop 随机裁剪
# 参数(w,h)
trans_random = transforms.RandomCrop((256,400))
trans_compose_2 = transforms.Compose([trans_random, trans_totensor])
for i in range(10):
    img_crop = trans_compose_2(img)
    writer.add_image("RandomCrop", img_crop, i)
writer.close()

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值