深度学习图像预处理中为什么使用零均值化(zero-mean)

最新推荐文章于 2025-03-16 09:41:56 发布

会意

最新推荐文章于 2025-03-16 09:41:56 发布

阅读量2.2w

点赞数 23

分类专栏：深度学习文章标签：零均值化

本文链接：https://blog.csdn.net/mooneve/article/details/81943904

版权

深度学习专栏收录该内容

8 篇文章

订阅专栏

本文介绍深度学习中零均值化的概念及其实现方法，并通过数学原理阐述其如何提高神经网络权重参数的收敛速度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在深度学习中，一般我们会把喂给网络模型的训练图片进行预处理，使用最多的方法就是零均值化(zero-mean) / 中心化，即让所有训练图片中每个位置的像素均值为0，使得像素值范围变为[-128,127]，以0为中心。

举个例子，假设训练图片有5000张，图片大小为32*32，通道数为3，则用python表示如下：

x_train = load_data(img_dir)  # 读取图片数据 x_train的shape为(5000,32,32,3)
x_train = np.reshape(x_train, (x_train.shape[0], -1))  # 将图片从二维展开为一维，x_train 变为(5000,3072)
mean_image = np.mean(x_train, axis=0)  # 求出所有图片每个像素位置上的平均值 mean_image为(1, 3072)
x_train -= mean_image  # 减去均值图像，实现零均值化

这样做的优点是为了在反向传播中加快网络中每一层权重参数的收敛。为什么能加快呢？李飞飞的cs231n课程中给出了很好的解释。
这里写图片描述
我们来看一下神经网络中的计算过程，如上图所示通常每一层的计算公式都可以表示成上面这个式子。假设上游返回的梯度为L，运用链式法则，反向传播时权重的梯度可以表示如下：