Normalization

最新推荐文章于 2023-08-10 11:42:43 发布

fly_jx

最新推荐文章于 2023-08-10 11:42:43 发布

阅读量122

点赞数

分类专栏：机器学习文章标签：自然语言处理

本文链接：https://blog.csdn.net/weixin_42145837/article/details/124147341

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

机器学习中Normalization

1：为什么需要Normalization

神经网络训练开始前，都要对输入数据进行归一化处理，那么为什么需要归一化？归一化后有什么好处呢？

机器学习有个很重要的假设： IID独立同分布，就是假设训练数据和测试数据是满足相同分布的。因此在数据喂给模型之前，进行“白化”，其中最典型的白化方法是PCA。白化一般包含两个步骤：
1：去除特征之间的相关性：独立
2：使得所有特征具有相同的均值和方差：同分布

每批数据的分布各不相同，就是导致模型会去拟合各个不同的分布，降低收敛速度。
深度学习训练是有个非常复杂的过程，前面几层微小的变化在后面的层会被积累放大。一旦网络某一层的输入发生变化，那么这一层就要去适应学习这个新的分布，所以如果训练过程中，输入一直发生变化，就会影响网络的训练速度。

2： Internal Covariate Shift(内部协变量转移)

统计机器学习中有个经典的假设是源空间和目标空间的分布是一致的，如果不一致，就出现新的机器学习方向，如transfer learning/domain adaptation等。而Covariate shift就是分布不一致假设之下的一个分支问题，它是指源空间和目标空间条件概率是一致的，但是其边缘概率不同，
在这里插入图片描述
神经网络各层的输出经过层内操作显然与输出的分布是不一致的，且这种差异随着网络的加深不断增大，但是他们所能“指示”的样本标记是仍然不变的，这变符合CS的定义。由于是对层间的信号的分析，也即是“internal”的来由