目录
torchvision.transforms.ToTensor
torchvision.transforms.ToPILImage
torchvision.transforms.ToTensor
对于一个图片img,调用ToTensor转化成张量的形式,发生的不是将图片的RGB三维信道矩阵变成tensor
图片在内存中以bytes的形式存储,转化过程的步骤是:
- img.tobytes() 将图片转化成内存中的存储格式
- torch.BytesStorage.frombuffer(img.tobytes() ) 将字节以流的形式输入,转化成一维的张量
- 对张量进行reshape
- 对张量进行permute(2,0,1)
- 将当前张量的每个元素除以255
- 输出张量
torchvision.transforms.ToPILImage
对于一个Tensor的转化过程是:
- 将张量的每个元素乘上255
- 将张量的数据类型有FloatTensor转化成Uint8
- 将张量转化成numpy的ndarray类型
- 对ndarray对象做permute (1, 2, 0)的操作
- 利用Image下的fromarray函数,将ndarray对象转化成PILImage形式
- 输出PILImage