常用数据归一化方法

    数据归一化是为了缩小数量之间的相对关系以及消除指标之间的量纲影响,解决数据指标之间的可比性。数据经过归一化处理之后,各指标处于同一数量级,方便进一步处理数据。
    机器学习中数据处理时常用的数据归一化方法有以下三种:
    
1. 最值归一化(Feature scaling)
    这是一种线性归一化方法,对原始数据进行线性变换,使原始数据映射到[0,1]或者某个自定义的区间内。
    映射到[0,1]区间:


[0-1]区间

    映射到[a, b]区间:


[a, b]区间

    
2. 标准方差归一化(Standard score)
    这种方法是基于原始数据的均值和方差的归一化方法。标准化后的数据均值为0,方差为1,服从标准正态分布。


这里写图片描述

    其中,μ为原始数据均值,σ为原始数据标准方差。
    
3. 中值归一化
    此方法多用于数据中没有错误样本,只是单纯将数据等比例扩大或者缩小的情况。


这里写图片描述

更多内容

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值