莫凡Python学习笔记——神经网络的检验(二):特征数据标准化

内容原文:https://morvanzhou.github.io/tutorials/machine-learning/torch/

为了让神经网络更好的消化,我们需要对数据进行特征标准化。
一般的数据可能来源不同,规格不同,采集方式不同,以买房的例子为例:
离市中心的距离数据变化差距不是很大,楼层也不是很大,但是面积的变化差距还是挺大的。我们利用这三组数据对房子的价格进行预测,假如这里面面积对于价格的影响最大,但是神经网络并不知道,在误差反向传播的时候,误差的修正是每个参数平均分摊修正的,但是假如楼层对影响不大,面积影响大,修正同样的误差量,面积很快就可以修正好,但是楼层可以需要很久的时间,这样就导致效率很低。
这里写图片描述
再比如,三个人一起工作,a的能力较弱,b一般,c能力较强,当他们合作做一项工作的时候,c会很快做好工作,而a就会很慢才完成,完成之后老板觉得他们的工作还有可以进步的地方,于是三人平摊任务继续干活,但是又是c很快就完成了,但是a则需要很长的时间,c,b都要等a完成工作才能去交工,这就导致效率很低了。
这里写图片描述

这时我们可以将数据进行标准化:展宽跨度小的数据,压缩跨度大的数据。这样不仅可以加快机器学习的速度,还能够避免机器学习学习的特别扭曲。目前比较流行的标准化方法有minmax normalization 和 std normalization,前一种是将数据按比例缩放到(0,1)区间,后一种是将数据转换为均值为0,方差为1的数据。

这里写图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值