归一化公式

AI Agent首席体验官

于 2025-03-13 07:13:30 发布

阅读量1.3k

点赞数 25

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44705554/article/details/146220948

版权

1. 归一化（Normalization）公式，也称为最小-最大归一化（Min-Max Normalization)

$X_{norm} = \frac{X - X_{min}}{X_{max} - X_{min}}$

公式含义

这个公式将原始数据 $X$ 从其原始范围转换到 $[0, 1]$ 的范围内。

公式各部分解释

$X$ ：原始数据值
$X_{min}$ ：数据集中的最小值
$X_{max}$ ：数据集中的最大值
$X_{norm}$ ：归一化后的数据值

工作原理

首先计算 $X - X_{min}$ ，这将所有值平移，使最小值变为0
然后除以 $X_{max} - X_{min}$ （即数据的范围），这样将数据缩放到 $[0, 1]$ 区间

特点

归一化后的数据范围是 $[0, 1]$
原始数据中的最小值 $X_{min}$ 被映射为0
原始数据中的最大值 $X_{max}$ 被映射为1
保持了原始数据的分布形状，只是缩放了范围

应用场景

归一化在机器学习和数据挖掘中非常常用，特别是：

特征缩放，使不同量纲的特征可比较
梯度下降算法中加速收敛
神经网络中防止梯度消失或爆炸
图像处理中的像素值标准化

示例

假设有一组数据：[5, 10, 15, 20, 25]

$X_{min} = 5$
$X_{max} = 25$

对于值 $X = 15$ 的归一化计算： $X_{norm} = \frac{15 - 5}{25 - 5} = \frac{10}{20} = 0.5$

因此，原始值15归一化后变为0.5。

整个数据集归一化后变为：[0, 0.25, 0.5, 0.75, 1]

2. 归一化意义在哪

归一化在数据处理和机器学习中具有多方面的重要意义：

1. 消除量纲影响

不同特征可能有不同的量纲和范围（如身高、体重、年龄），归一化使各特征在相同尺度上进行比较，避免某些特征因数值较大而主导模型。

2. 提高算法性能

加速梯度下降收敛：当特征数据分布较均匀时，梯度下降法收敛更快、更平稳
提高某些算法精度：如KNN、SVM、神经网络等对特征尺度敏感的算法效果更好

3. 提高数值稳定性

防止梯度消失/爆炸：在神经网络中，归一化数据有助于保持梯度在合适范围内
减少舍入误差：特别是在计算机浮点运算中

4. 方便特征比较与可视化

将不同量级的特征放在同一坐标系中进行直观比较
便于判断各特征的相对重要性

5. 满足算法前提条件

某些算法（如PCA、聚类算法）隐含假设所有特征具有相似的尺度

6. 提高模型的可解释性

归一化后的系数直接反映特征的相对重要性，更易于解释模型

示例说明

假设有两个特征：

年龄：20-80岁
收入：5000-100000元

如果不归一化，收入特征的数值变化将完全主导模型，而年龄特征的影响几乎可以忽略。归一化后，两个特征都在[0,1]范围内，模型能够公平地评估每个特征的实际重要性。

归一化是数据预处理的基础步骤，对于构建高质量、可靠的机器学习模型至关重要。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI Agent首席体验官 您的打赏是我继续创作的动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。