pytorch:把图片数据转化成tensor

摘要: 在图像识别当中,一般步骤是先读取图片,然后把图片数据转化成tensor格式,再输送到网络中去。本文将介绍如何把图片转换成tensor。

一、数据转换

把图片转成成torch的tensor数据,一般采用函数:torchvision.transforms。通过一个例子说明,先用opencv读取一张图片,然后在转换;注意一点是:opencv储存图片的格式和torch的储存方式不一样,opencv储存图片格式是(H,W,C),而torch储存的格式是(C,H,W)。

import torchvision.transforms as transforms
import cv2 as cv

img = cv.imread('image/000001.jpg')
print(img.shape)   # numpy数组格式为(H,W,C)

transf = transforms.ToTensor()
img_tensor = transf(img)  # tensor数据格式是torch(C,H,W)
print(img_tensor.size())

在这里插入图片描述

注意:使用torchvision.transforms时要注意一下,其子函数 ToTensor() 是没有参数输入的,以下用法是会报错的

img_tensor = transforms.ToTensor(img)

必须是先定义和赋值转换函数,再调用并输入参数,正确用法:

img = cv.imread('image/000001.jpg')
transf = transforms.ToTensor()
img_tensor = transf(img)

再转换过程中正则化

在使用 transforms.ToTensor() 进行图片数据转换过程中会对图像的像素值进行正则化,即一般读取的图片像素值都是8 bit 的二进制,那么它的十进制的范围为 [0, 255],而正则化会对每个像素值除以255,也就是把像素值正则化成 [0.0, 1.0]的范围。通过例子理解一下:

import torchvision.transforms as transforms
import cv2 as cv

img = cv.imread('image/000001.jpg')
transf = transforms.ToTensor()
img_tensor = transf(img)
print('opencv', img)
print('torch', img_tensor)

在这里插入图片描述
在这里插入图片描述

三、自行修改正则化的范围

使用transforms.Compose函数可以自行修改正则化的范围,下面举个例子正则化成 [-1.0, 1.0]

transf2 = transforms.Compose(
    [
        transforms.ToTensor(),
        transforms.Normalize(mean=(0.5, 0.5, 0.5), std=(0.5, 0.5, 0.5))
    ]
)

img_tensor2 = transf2(img)
print(img_tensor2)

在这里插入图片描述
计算方式就是:C=(C-mean)/ std
C为每个通道的所有像素值,彩色图片为三通道图像(BGR),所以mean和std是三个数的数组。使用transforms.ToTensor()时已经正则化成 [0.0, 1.0]了,那么(0.0 - 0.5)/0.5=-1.0,(1.0 - 0.5)/0.5=1.0,所以正则化成 [-1.0, 1.0]

  • 59
    点赞
  • 161
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: 在使用PyTorch进行机器学习或深度学习的过程中,将Tensor类型转化为图片是常见且必要的一步。PyTorch提供了很多方法将Tensor类型转化为图片,以下是其中的两种方法: 方法一:使用PIL库 通过PIL库将Tensor类型转化为图片是一种简单且高效的方法。以下是具体的实现步骤: 1. 首先,需要将Tensor类型转化为numpy数组。 2. 然后,将numpy数组转化为PIL图像。 3. 最后,将PIL图像保存为图片或者显示出来。 以下是代码示例: import torch from PIL import Image # 将Tensor类型转化为numpy数组 tensor = torch.randn(3, 256, 256) numpy_array = tensor.numpy() # 将numpy数组转化为PIL图像 image = Image.fromarray(numpy_array) # 保存图像 image.save('test.png') # 显示图像 image.show() 方法二:使用matplotlib库 matplotlib是一个常用的数据可视化库,其中包含了将Tensor类型转化为图片的方法。以下是具体的实现步骤: 1. 首先,需要将Tensor类型转化为numpy数组。 2. 然后,使用matplotlib的imshow函数将numpy数组显示为图像。 3. 最后,使用show函数显示出来。 以下是代码示例: import torch import matplotlib.pyplot as plt # 将Tensor类型转化为numpy数组 tensor = torch.randn(3, 256, 256) numpy_array = tensor.numpy() # 显示图像 plt.imshow(numpy_array) plt.show() 总结: 以上就是将Tensor类型转化为图片的两种方法。这些方法也可以用于将Tensor类型的数据可视化。在实际应用中,可以根据具体的情况选择合适的方法。 ### 回答2: PyTorch是一个流行的开源深度学习框架,用户可以将张量(tensor)类型的数据输入到神经网络模型中进行训练并进行预测。在有些情况下,我们可能需要将张量数据转化为图片的形式进行可视化。 在PyTorch中,将张量类型转化为图片需要使用到PIL库,因此需要先安装PIL库。 一般而言,将张量转换为图片的步骤如下: 1.首先,我们需要有一个张量,该张量的形状应该为(N, C, H, W)。其中,N表示图片的数量,C表示图片的通道数(例如:灰度图像为1通道,RGB图像为3通道),H和W表示图片的高度和宽度。 2.接下来,我们需要将张量中的数值范围规范化到0到255之间,方便后续处理。如果张量的最大值和最小值不在0到255之间,我们可以使用torch.clamp()函数将张量数值限制在0到255之间。 3.外部PIL库需要将张量转换为图片格式的数字数组。因此,我们需要使用torch.Tensor.permute()函数将张量尺寸重新排列。如果使用的是彩色图像,则张量的尺寸应该为(N, H, W, C)。如果使用的是灰度图像,则张量的尺寸应该为(N, H, W)。 4.现在,我们可以使用PIL库中的Image.fromarray()函数将调整后的张量数据转化为图片。如果使用的是彩色图像,则需要设置参数mode='RGB'。如果使用的是灰度图像,则需要设置参数mode='L'。 5.最后,我们可以调用图片对象的save()函数将图片保存到本地文件中,或者调用show()函数在程序中显示转换后的图片。 下面是一个示例代码,将张量转换为图片并保存到本地: ``` import torch from PIL import Image # 定义一个4张,3通道,高为128,宽为128的随机张量 t = torch.randn(4, 3, 128, 128) # 将张量数值范围规范化到0~255之间 t = torch.clamp(t * 255, 0, 255) # 将张量尺寸重新排列,将通道数C放到最后一维 t = t.permute(0, 2, 3, 1) # 将张量转换为图片对象 img = Image.fromarray(t[0].cpu().numpy().astype('uint8'), mode='RGB') # 保存图片到本地 img.save('tensor_to_image.jpg') ``` 在上述示例代码中,我们首先定义一个随机纯色张量t,该张量的大小为(4, 3, 128, 128),即有4张128x128像素的三通道彩色图像。接下来,我们使用torch.clamp()函数将张量中的数字限制在0~255之间,再将张量尺寸重新排列,将通道数放到最后的维度。接着,我们使用PIL库中的Image.fromarray()函数将张量转换为图片对象img,该图片对象可以使用save()函数保存到本地文件,或者使用show()函数在程序中进行查看。 总之,将张量类型转化为图片的主要步骤是将张量尺寸重新排列,并使用PIL库将调整后的张量数据转换为图片格式的数字数组。这样便可以转换为可以呈现的图像。 ### 回答3: 在 PyTorch 中,将 Tensor 转化为图片主要分为两种情况:将 Tensor 保存为图片文件和在代码中将 Tensor 可视化为图片。以下分别介绍这两种情况的具体实现方法: 一、将 Tensor 保存为图片文件 1. 使用 PIL 库将 Tensor 转化为图片 首先需要导入 PIL 库: ``` from PIL import Image ``` 然后,将 Tensor 转化为 PIL 图片对象: ``` tensor_image = torch.tensor(image_data) # image_data 为 Tensor 格式的数据 pil_image = Image.fromarray(tensor_image.numpy()) ``` 最后将保存为图片: ``` pil_image.save("image.png") ``` 2. 使用 OpenCV 库将 Tensor 转化为图片 首先需要导入 OpenCV 库: ``` import cv2 ``` 然后,将 Tensor 转化为 cv2 图片对象: ``` tensor_image = torch.tensor(image_data) # image_data 为 Tensor 格式的数据 cv2_image = cv2.cvtColor(tensor_image.numpy(), cv2.COLOR_RGB2BGR) ``` 最后将保存为图片: ``` cv2.imwrite("image.png", cv2_image) ``` 二、在代码中将 Tensor 可视化为图片 在使用 PyTorch 进行神经网络训练的时候,可以使用一些工具库来可视化训练过程中的结果,例如使用 TensorBoard 或者使用 matplotlib 库可视化。以下是使用 matplotlib 库的方法: 首先需要导入 matplotlib 库: ``` import matplotlib.pyplot as plt ``` 然后,使用以下代码将 Tensor 可视化为图片: ``` plt.imshow(tensor_image.permute(1, 2, 0).cpu().numpy()) # tensor_image 为 Tensor 格式的数据 plt.show() ``` 在这里需要注意的是,如果 Tensor 的通道数为第一维,需要使用 `permute` 函数将通道维度移动到最后一维。如果 Tensor 存储在 GPU 上,需要使用 `cpu()` 函数将 Tensor 转移到 CPU 上后再进行可视化。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值