为什么需要对数值类型的特征做归一化?

为什么需要对数值类型的特征做归一化?

1. 举例子

比如分析一个人的身高和体重对健康的影响,身高的单位是m,范围是1.6-1.8
体重的单位是kg,在50kg-100kg之间,分析出的结果自然会倾向于数值差异较大的体重特征。因此我们需要数值归一化,使得各个指标处于同一数量量级

2.归一化有哪些方法

(1) 线性函数归一化(Min-Max Scaling)

对原始数据进行线性变换,实现对原数据的等比缩放
X n o r m = X − X m i n X m a x − X m i n X_{norm}=\frac{X-X_{min}}{X_{max}-X_{min}} Xnorm=XmaxXminXXmin

(2) 零均值归一化 (Z-Score Normalization)

将原始数据映射到标准正态分布上(基于假设大多数原有数据都属于正态分布)
z = x − u σ z=\frac{x-u}{\sigma} z=σxu

3.归一化对于梯度下降也有加速作用

在这里插入图片描述

归一化后的数据有助于在求解是缓解求解过程中的参数寻优的动荡,以加快收敛。对于不归一化的收敛,可以发现其参数更新、收敛如左图,归一化后的收敛如右图。可以看到在左边是呈现出之字形的寻优路线,在右边则是呈现较快的梯度下降

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值