特征归一化的好处_min-maxnormalization的好处-CSDN博客

本文链接：https://blog.csdn.net/weixin_45834085/article/details/102993006

特征归一化是预处理数据的关键步骤，它有助于提高模型精度，特别是对于涉及距离计算的算法，如KNN和SVM。归一化方法包括Min-Max标准化和z-score标准化。Min-Max方法将数据映射到[0,1]区间，适用于数值较集中的情况，但当最大值和最小值变化时可能不稳定。z-score标准化则确保数据遵循标准正态分布，适用于需要考虑协方差和距离度量的场景。在涉及梯度计算的问题中，归一化能加速模型的收敛速度。" 137095931,11319797,Quartz定时任务实战与Spring整合指南,"['java', 'spring', '面试', 'Quartz', '任务调度']

摘要由CSDN通过智能技术生成

神经网络学习过程本质就是为了学习数据分布，一旦训练数据与测试数据的分布不同，那么网络的泛化能力也大大降低；另外一方面，一旦每批训练数据的分布各不相同(batch 梯度下降)，那么网络就要在每次迭代都去学习适应不同的分布，这样将会大大降低网络的训练速度，这也正是为什么我们需要对数据都要做一个归一化预处理的原因。基于参数的模型或基于距离的模型，都是要进行特征的归一化。

一.什么是特征归一化

数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是数据的归一化处理，即将数据统一映射到[0,1]区间上。

二.数据标准化的意义

数据的量纲不同；数量级差别很大
经过标准化处理后，原始数据转化为无量纲化指标测评值，各指标值处于同一数量级别，可进行综合测评分析。
如果直接用原始指标值进行分析，就会突出数值较高的指标在综合分析中的作用，相对削弱数值水平较低指标的作用。
避免数值问题：太大的数会引发数值问题。
提升模型的精度
例如:x1的取值为0-2000，而x2的取值为1-5，提高精度，这在涉及到一些距离计算的算法时效果显著，比如算法要计算欧氏距离，x2的取值范围比较小，涉及到距离计算时其对结果的影响远比x1带来的小，所以这就会造成精度的损失。所以归一化很有必要，他可以让各个特征对结果做出