深度学习_深度学习基础知识_数据归一化

最新推荐文章于 2024-03-16 15:35:24 发布

Rocky Ding*

最新推荐文章于 2024-03-16 15:35:24 发布

阅读量2.4k

点赞数

分类专栏： # 深度学习基础知识文章标签：深度学习机器学习神经网络数据归一化人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Rocky6688/article/details/105035571

版权

深度学习基础知识专栏收录该内容

30 篇文章 6 订阅

订阅专栏

归一化的主要公式

1.将数据归一到[0,1]：

$x^{\prime} =\frac{x - min(x)}{max(x)-min(x)}$

其中 $m a x (x)$ 和 $m i n (x)$ 分别是数据的最大值和最小值。

2.将数据归一化到[-1,1]：

$x^{\prime}=\frac{x-mean(x)}{max(x)-min(x)}$

其中 $m e a n (x)$ 是数据的均值。

3.将数据归一化到均值为0，标准差为1的标准正态分布上：

$x^{\prime}= \frac{x-\mu}{\sigma}$

其中 $\mu$ 和 $\sigma$ 分别是数据的均值和标准差。

4.将数据归一化到[a,b]：

计算系数：
$k=\frac{b-a}{max(x)-min(x)}$

数据归一化：

$x^{\prime}=a+k\times(x-min(x))$

或者

$x^{\prime}=b+k\times(x-max(x))$

归一化的作用

消除数据之间的量纲的影响，是数据的分布一致。（尤其是神经网络一直在算概率）
使数据集的更新速度变得更为一致，容易更快地通过梯度下降找到最优解（加速收敛速度）。如下图所示。
消除异常样本的影响，异常样本会增加网络学习难度，可能导致训练不收敛。
保证输出特征中数值小的特征也可以被充分学习。
避免梯度消失，比如使用Sigmoid激活函数时，数值小于0和大于1时会导致梯度几乎为0。

在这里插入图片描述

归一化应用场景

需要用到梯度下降法求解的模型通常需要归一化，如线性回归，罗辑回归，支持向量机和神经网络等模型。

但是对于决策树则并不适用，以C4.5为例，决策树在进行节点分裂时主要依据数据集D关于特征x的信息增益比，而信息增益比跟特征是否经过归一化是无关的，因为归一化并不会改变样本在特征x上的信息增益。

不进行归一化的后果

假设 $w 1$ 的范围在 $[- 10, 10]$ ，而 $w 2$ 的范围在 $[- 100, 100]$ ，梯度每次都前进 1 单位，那么在 $w 1$ 方向上每次相当于前进了 $1 / 20$ ，而在 $w 2$ 上只相当于 $1 / 200$ ！某种意义上来说，在 $w 2$ 上前进的步长更小一些,而 $w 1$ 在搜索过程中会比 $w 2$ “走”得更快。

这样会导致，在搜索过程中更偏向于 $w 1$ 的方向。走出了“L”形状，或者成为“之”字形。

在这里插入图片描述

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习_深度学习基础知识_数据归一化

归一化的主要公式1.将数据归一到[0,1]：x′=x−min(x)max(x)−min(x)x^{\prime} =\frac{x - min(x)}{max(x)-min(x)} x′=max(x)−min(x)x−min(x)其中max(x)max(x)max(x)和min(x)min(x)min(x)分别是数据的最大值和最小值。2.将数据归一化到[-1,1]：x′=x−mean(...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Rocky Ding* 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。