数据归一化、标准化和去中心化

数据预处理,一般有数据归一化、标准化和去中心化。

归一化

将数据映射到[0,1]或[-1,1]区间范围内,不同特征的量纲不同,值范围大小不同,存在奇异值,对训练有影响。

标准化

将数据映射到满足标准正态分布的范围内,使数据满足均值为0,标准差为1。标准化同样可以消除不同特征的量纲。

去中心化

使数据满足均值为0,但对标准差没有要求。

每种方法对应的使用场景

1.若对数据的范围没有限定要求,则选择标准化进行数据预处理
2.若要求数据在某个范围内取值,则采用归一化。
3若数据不存在极端的极大极小值时,采用归一化。
4.若数据存在较多的异常值和噪音,采用标准化。

为什么需要对数据进行归一化或标准化

归一化/标准化可以使模型学习更快,少走弯路
在梯度下降过程中,不同特征值差异较大,则损失函数的等高线是个椭圆,因此梯度方向是拐来拐去,进行归一化/标准化后,等高线就变成近似圆,梯度方向比较平缓,少走弯路。
在这里插入图片描述
避免数值问题
输入值过大时,容易出现数值问题,如2344x0.0002 与0.2344x2在计算机中算出来是不相等,而实际应该是相等的。
神经网络的需要
在这里插入图片描述
参考:https://www.jianshu.com/p/95a8f035c86c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值