【无聊问题之】归一化一定要归到一吗

还是先说答案:

当然不是( ´Д`)

归一化(Normalization)并不一定要将数据严格归一到1。归一化是一个将数据调整到特定范围的过程,通常这个范围是[0, 1]或[-1, 1],但也可以根据具体需求选择其他范围。重要的是,归一化的目的是消除数据的量纲影响,使不同特征或指标之间具有可比性。

如标准化(Standardization),它将数据转换为均值为0,标准差为1的分布。这种方法并不将数据限制在[0, 1]的范围内,但它同样实现了数据的尺度统一。

顺路介绍一下归一化的实现方法:

1. 最小-最大归一化(Min-Max Normalization)

这是最常见的一种归一化方法,它将数据线性变换到[0, 1]的范围。

其中,x 是原始数据,x′ 是归一化后的数据,min(x) 和 max(x) 分别是数据中的最小值和最大值。  

  • 将数据线性变换到 [0, 1] 的范围。
  • 保留了原始数据的结构(相对大小关系不变)。
  • 对异常值敏感,因为异常值会影响最大值和最小值。
  • 如果数据集的最大值和最小值不稳定(例如,在流数据或时间序列数据中),则每次更新都需要重新计算。

2. 标准化(Standardization)

也被称为Z-score归一化,它将数据转换为均值为0,标准差为1的分布。

其中,μ 是数据的均值,σ 是数据的标准差

  • 将数据转换为均值为 0,标准差为 1 的分布。
  • 不受数据集中特定值(如最大值、最小值)的影响,因此对异常值相对稳健。
  • 在许多机器学习算法中表现良好,特别是那些基于梯度下降的优化算法。
  • 转换后的数据可能不再保留原始数据的结构(如,负数和正数的相对大小关系可能会改变)。

3. 最大绝对值归一化(Max Absolute Scaling)

将数据线性变换到[-1, 1]的范围。公式如下:

如果数据中有负数,则使用数据的最大绝对值进行缩放。

  • 将数据线性变换到 [-1, 1] 或 [0, 1] 的范围(取决于具体公式)。
  • 使用了绝对值的最大值,因此可以处理包含负数的数据。
  • 对异常值敏感,因为异常值可能会影响绝对值的最大值。
  • 与最小-最大归一化类似,如果数据集的最大绝对值不稳定,则需要重新计算。

在实际应用中,选择哪种归一化方法取决于数据的性质、算法的要求以及特定场景的需求。

例如,在深度学习中,标准化通常是首选方法,因为它有助于缓解内部协变量偏移(Internal Covariate Shift)问题,从而加速神经网络的训练过程。然而,在某些情况下,如当数据具有明确的边界且不含异常值时,最小-最大归一化可能更为合适。

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值