数据 归一化(标准化)

作用

当样本的各个特征的数量级相差较大,那么不同特征对模型的影响也会有较大的差别。为了使每个特征都具有相同的重要性,通过归一化(标准化),来把所有特征的范围化为同一量级。

  • 使用梯度下降法求解最优化问题的数值解的时候,归一化的优势:

    1 可以提升模型的收敛速度。归一化后优化形状变为圆形,梯度方向直指圆心,迭代速度变快,大大减少寻找最优解的时间;
    2 提升模型的精度。设计距离计算时,数量级小的特征对结果的影响远远小于数量级大的特征,对精度造成损失,归一化可以使各个特征对结果做出的贡献相同。

常见方法

  • Standardization
    在这里插入图片描述
    利用均值与标准差来计算,最终取值范围是[-1 , 1]
  • Min-Max Scaling
    在这里插入图片描述
    利用最小值和最大值来计算,取值范围是[0 , 1]

应用

  • KNN中、岭回归
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值