机器学习特征缩放的作用

作用

加快梯度下降法的收敛速度

什么是特征

例如我们要做房屋价格预测,暂时选取两个特征:房屋面积、卧室个数。

根据这两个特征的取值情况可以预估:房屋面积取值范围  (0,2000)       卧室个数(0,5)

初步感觉面积的值比卧室个数大很多,这样可能会造成训练过程的过分震荡,可能会使收敛速度变慢。

从等值线图也可以看的出来这样的结果。

当然最严谨的证明方法是数学证明法。

 

特征缩放

对同一特征进行等比例放大缩小,令 S为房屋面积,N为卧室个数

做变换       S := S / 2000            N := N / 5

变换后的   S∈(0,1)   N∈(0,1)

那么这个过程就是特征缩放过程的一种示例,经过这样的变换后模型收敛花费的时间就会减少。

在实际的运用中会有各种各样的缩放方法

(1)最大最小值归一化(min-max normalization):将数值范围缩放到 [0, 1] 区间里

 

(2)均值归一化(mean normalization)将数值范围缩放到 [-1, 1] 区间里,且数据的均值变为0

 

(3)标准化 / z值归一化(standardization / z-score normalization:将数值缩放到0附近,且数据的分布变为均值为0,标准差为1的标准正态分布(先减去均值来对特征进行 中心化 mean centering 处理,再除以标准差进行缩放)

 

(4)最大绝对值归一化(max abs normalization )也就是将数值变为单位长度(scaling to unit length),将数值范围缩放到 [-1, 1] 区间里

 

(5)稳键标准化(robust standardization):先减去中位数,再除以四分位间距(interquartile range),因为不涉及极值,因此在数据里有异常值的情况下表现比较稳健

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

会写代码的孙悟空

赠人玫瑰 手有余香

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值