06 Transforms的使用

GMRCCC

已于 2023-08-02 10:34:03 修改

阅读量33

点赞数

分类专栏： Pytorch快速入门文章标签： python

于 2023-08-02 10:21:47 首次发布

本文链接：https://blog.csdn.net/qq_31224965/article/details/132056397

版权

Pytorch快速入门专栏收录该内容

9 篇文章 0 订阅

订阅专栏

本文介绍了PyTorch中的transforms模块，特别是ToTensor类，它将PIL或numpy格式的图片转换为张量，以便神经网络处理。Normalize用于图像正则化。ToTensor是神经网络训练中必不可少的数据类型转换步骤。

摘要由CSDN通过智能技术生成

Transforms的结构及用法

transforms指的是transforms.py这个文件，像一个工具箱，工具箱中有很多的工具。向transforms中输入一个图片，就能输出我们想要的结果。

首先从torchvision这个工具包中导入transforms

from torchvision import transforms

transforms中有Compose(图片经过中心裁剪后送到ToTensor方法中)方法和ToTensor方法(将图片格式转化为Tensor)，还有Normalize(正则化)等等。

在这里插入图片描述

ToTensor类

Convert a ``PIL Image`` or ``numpy.ndarray`` to tensor. This transform does not support torchscript.

ToTensor类将一个PIL或者numpy格式的图片转换为tensor格式。

from PIL import Image
from torchvision import transforms

img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)
print(img)

输出：
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=768x512 at 0x1EF1648DE50>

可以看到，图片为PIL格式，我们可以用totensor将其转为tensor格式。

注意ToTensor是一个类，我们需要创建它的实例化对象

tensor_trans = transforms.ToTensor()

ToTensor类中有call方法，这个方法类似于C++中重载()运算符，可以直接通过()进行调用

def __call__(self, pic):  
    """  
    Args:        
	    pic (PIL Image or numpy.ndarray): Image to be converted to tensor.  
    Returns:        
	    Tensor: Converted image.    
	"""    
	return F.to_tensor(pic)

调用call来转换图片类型

tensor_img = tensor_trans(img)
print(tensor_img)

输出：
tensor([[[0.3137, 0.3137, 0.3137,  ..., 0.3176, 0.3098, 0.2980],
         [0.3176, 0.3176, 0.3176,  ..., 0.3176, 0.3098, 0.2980],
         [0.3216, 0.3216, 0.3216,  ..., 0.3137, 0.3098, 0.3020],
         ...,
         [0.3412, 0.3412, 0.3373,  ..., 0.1725, 0.3725, 0.3529],
         [0.3412, 0.3412, 0.3373,  ..., 0.3294, 0.3529, 0.3294],
         [0.3412, 0.3412, 0.3373,  ..., 0.3098, 0.3059, 0.3294]],

        [[0.5922, 0.5922, 0.5922,  ..., 0.5961, 0.5882, 0.5765],
         [0.5961, 0.5961, 0.5961,  ..., 0.5961, 0.5882, 0.5765],
         [0.6000, 0.6000, 0.6000,  ..., 0.5922, 0.5882, 0.5804],
         ...,
         [0.6275, 0.6275, 0.6235,  ..., 0.3608, 0.6196, 0.6157],
         [0.6275, 0.6275, 0.6235,  ..., 0.5765, 0.6275, 0.5961],
         [0.6275, 0.6275, 0.6235,  ..., 0.6275, 0.6235, 0.6314]],

        [[0.9137, 0.9137, 0.9137,  ..., 0.9176, 0.9098, 0.8980],
         [0.9176, 0.9176, 0.9176,  ..., 0.9176, 0.9098, 0.8980],
         [0.9216, 0.9216, 0.9216,  ..., 0.9137, 0.9098, 0.9020],
         ...,
         [0.9294, 0.9294, 0.9255,  ..., 0.5529, 0.9216, 0.8941],
         [0.9294, 0.9294, 0.9255,  ..., 0.8863, 1.0000, 0.9137],
         [0.9294, 0.9294, 0.9255,  ..., 0.9490, 0.9804, 0.9137]]])

可以看到转为了tensor数据类型。

由于tensor是一个类，因此对transform工具包更确切的表述应该是这样

在这里插入图片描述

为什么我们需要tensor数据类型

tensor数据类型包装了反向神经网络需要的一些理论基础的参数，所以在神经网络中我们需要把图片转换为tensor型。

GMRCCC

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
06 Transforms的使用

transforms中有Compose(图片经过中心裁剪后送到ToTensor方法中)方法和ToTensor方法(将图片格式转化为Tensor)，还有Normalize(正则化)等等。transforms指的是transforms.py这个文件，像一个工具箱，工具箱中有很多的工具。tensor数据类型包装了反向神经网络需要的一些理论基础的参数，所以在神经网络中我们需要把图片转换为tensor型。ToTensor类中有call方法，这个方法类似于C++中重载()运算符，可以直接通过()进行调用。
复制链接

扫一扫