pytorch transforms.ToPILImage()与torchvision.utils.save_imag()结果不同

最新推荐文章于 2024-02-07 15:33:01 发布

Sliverp

最新推荐文章于 2024-02-07 15:33:01 发布

阅读量386

点赞数 3

分类专栏：随手记录平时遇到的问题文章标签： pytorch python 深度学习

本文链接：https://blog.csdn.net/qq_39791850/article/details/129024018

版权

随手记录平时遇到的问题专栏收录该内容

6 篇文章 0 订阅

订阅专栏

在复现模型过程中，发现由于使用transforms.ToPILImage()和torchvision.utils.save_image()进行图像转换的方式不同，导致保存的图片结果存在明显差异。关键在于transforms.ToPILImage()缺少了unnormalizing后的0.5偏移和值限制步骤，这影响了最终的像素值，从而造成结果不匹配。在源码中添加缺失的步骤后，两者可得到相同结果。

摘要由CSDN通过智能技术生成

复现模型时发现，和原始代码的结果始终不同。
排查后发现时transforms.ToPILImage()与torchvision.utils.save_imag()结果不同导致的

transforms.ToPILImage()的转换如下：

def save_img_from_tensor(tensor, path):
    tens = tensor.squeeze()
    trans = transforms.Compose([
        transforms.ToPILImage()
    ])
    img = trans(tens)
    img.save(path)

torchvision.utils.save_imag()的转换如下

def save_img_from_tensor(tensor,path):
    torchvision.utils.save_image(tensor.cpu(), path)

结果差异很明显
在这里插入图片描述

具体原因

torchvision.utils.save_imag()使用的方式是

darr = grid.mul(255).add_(0.5).clamp_(0, 255).permute(1, 2, 0).to('cpu', torch.uint8).numpy()

transforms.ToPILImage()使用的方式时

if pic.is_floating_point() and mode != 'F':
    pic = pic.mul(255).byte()
npimg = np.transpose(pic.cpu().numpy(), (1, 2, 0))

缺少了add_(0.5).clamp_(0, 255)
经过测试吗，如果在源码中加入，则两者生成完全一致
官方解释是：
Add 0.5 after unnormalizing to [0, 255] to round to nearest integer

Sliverp

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pytorch transforms.ToPILImage()与torchvision.utils.save_imag()结果不同

transforms.ToPILImage()与torchvision.utils.save_imag()结果不同导致的torchvision.utils.save_imag()的转换如下结果差异很明显。
复制链接

扫一扫