【Stanford CNN课程笔记】6.神经网络的数据预处理

最新推荐文章于 2025-04-10 11:23:47 发布

Elaine_Bao

最新推荐文章于 2025-04-10 11:23:47 发布

阅读量1.6w

点赞数 5

分类专栏：计算机视觉文章标签：神经网络数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/elaine_bao/article/details/50889856

版权

本文介绍了神经网络数据预处理的重要性，包括0均值化、归一化、PCA和白化等方法。通过实例解释了如何对数据进行预处理，特别是针对图片数据如CIFAR-10。尽管PCA和白化在CNN中使用较少，但0均值化和归一化是常见的预处理步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天我们来讲一讲神经网络的数据预处理。

1. 数据预处理

数据预处理的方法通常有三种，假设数据矩阵X是一个N*D维的矩阵，N表示样本数目，D表示数据的维度。

0均值 是最常用的预处理方法，就是把数据的每一维-每一维的均值，这样数据就变成0均值的了。在numpy中，这个操作可以写成：X -= np.mean(X, axis = 0)。对于图片来讲，我们可以更简单地对所有pixel减去同一个均值（如 X -= np.mean(X)），当然也可以对RGB三个通道分别减均值。
归一化(Normalization) 是指将数据归一化到相同的尺度。通常有两种归一化的方法。第一种是0均值以后的数据的每一维/每一维的标准差（X /= np.std(X, axis = 0)）；另一种是将数据归一化到每一维的最大最小值为1和-1。这种归一化只适用于当你认为数据的不同维度应该具有相同的重要性时。对于图片来说，不同像素的尺度是基本一致的（0-255），因此我们并不需要对它进行归一化操作。
PCA和白化 是另一种形式的预处理方法。首先我们将数据变成0均值的，然后计算数据的协方差矩阵来得到数据不同维度之间的相关性：

# Assume input data mat

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。