数据预处理中的归一化与反归一化

最新推荐文章于 2025-03-19 17:08:57 发布

TracelessLe

最新推荐文章于 2025-03-19 17:08:57 发布

阅读量5.9k

点赞数 2

分类专栏： # 深度学习原理 # 深度学习框架 # Python 文章标签：人工智能深度学习 python PyTorch

本文为原创文章，独家发布在blog.csdn.net/TracelessLe。未经个人允许不得转载。如需帮助请email至tracelessle@163.com。

本文链接：https://blog.csdn.net/TracelessLe/article/details/116021329

版权

Python 同时被 3 个专栏收录

63 篇文章

订阅专栏

深度学习框架

35 篇文章

订阅专栏

深度学习原理

19 篇文章

订阅专栏

前言

在使用深度学习框架构建训练数据时，通常需要数据归一化（Normalize），以利于网络的训练。而在训练过程可视化中，通常需要反归一化。以PyTorch框架而言，提供了torchvision.transforms.Normalize(mean, std, inplace=False)方法用于归一化。

在这里插入图片描述

归一化

归一化的实质是将数据的分布根据均值和标准差进行调整。

#torchvision.transforms.Normalize(mean, std, inplace=False)
output[channel] = (input[channel] - mean[channel]) / std[channel]

在实际应用过程中通常有三种方式：

（1）普通归一化

将经过ToTensor()方法（能够把范围从[0,255]变换到[0,1]之间）后的数据缩放到[-1, 1]之间。

transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))

（2）ImageNet先验归一化

transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))

该均值和标准差来源于ImageNet数据集统计得到，如果建立的数据集分布和ImageNet数据集数据分布类似（来自生活真实场景，例如人像、风景、交通工具等），或者使用PyTorch提供的预训练模型，推荐使用该参数归一化。如果建立的数据集并非是生活真实场景（如生物医学图像），则不推荐使用该参数。

在这里插入图片描述

（3）计算数据集的均值和标准差

对于特定的数据集，可以直接通过对训练集进行统计计算其均值和标准差。

反归一化

针对普通归一化方法的反归一化：

def denorm(x):
    out = (x + 1) / 2
    return out.clamp_(0, 1)

针对ImageNet先验归一化方法的反归一化：

class UnNormalize(object):
    def __init__(self, mean, std):
        self.mean = mean
        self.std = std

    def __call__(self, tensor):
        """
        Args:
            tensor (Tensor): Tensor image of size (C, H, W) to be normalized.
        Returns:
            Tensor: Normalized image.
        """
        for t, m, s in zip(tensor, self.mean, self.std):
            t.mul_(s).add_(m)
            # The normalize code -> t.sub_(m).div_(s)
        return tensor


unorm = UnNormalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225))
unorm(tensor)