哪些机器学习模型需要归一化

小白tree

已于 2022-10-16 14:52:53 修改

阅读量4k

点赞数 11

分类专栏： python数据分析与挖掘机器学习文章标签：机器学习人工智能

于 2021-05-10 18:37:15 首次发布

本文链接：https://blog.csdn.net/weixin_43469047/article/details/116605053

版权

python数据分析与挖掘同时被 2 个专栏收录

27 篇文章

订阅专栏

机器学习

19 篇文章

订阅专栏

归一化是对连续特征来说的。那么连续特征的归一化，起到的主要作用是进行数值缩放。数值缩放的目的是解决梯度下降时，等高线是椭圆导致迭代次数增多的问题。

一、概率模型\树模型不需要归一化

而xgboost等树模型是不能进行梯度下降的，因为树模型是阶越的，不可导。树模型是通过寻找特征的最优分裂点来完成优化的。由于归一化不会改变分裂点的位置，因此xgboost不需要进行归一化。
参考《xgboost使用之前是否需要对数据进行归一化处理或者 ONEHOT处理?》

从概率模型角度，概率模型不关心变量值，而关心变量的分布、变量之间的条件概率。这类模型像决策树、随机森林。
关于为什么决策树和随机森林是概率模型，我觉得可以从《关于sklearn决策树和随机森林的predict_proba方法的原理解释》得到解释

二、关心变量值、使用梯度下降的算法，需要归一化

如逻辑斯特回归（logistic regression）、支持向量机（svm）、集成学习（adaboost）、KNN、K-Means等算法。

三、汇总

需要	不需要
LR（线性回归、逻辑回归）	决策树
SVM（支持向量机）	随机森林
KNN	朴素贝叶斯
K-Means	XGBoost
高斯过程	lightGBM
AdaBoost	GBDT
神经网络
LSTM

参考《哪些算法需要进行数据归一化？》

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小白tree

关注关注

11
点赞
踩
36

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

哪些机器学习算法不需要做归一化处理？

CSDN 精品推荐

08-09

693

在机器学习中，大多数算法都受益于数据的归一化处理，因为归一化可以帮助算法更快地收敛并提高模型的性能。尽管这些算法可能在某些情况下不需要进行归一化处理，但通常来说，数据归一化可以提高模型的性能、稳定性和收敛速度。虽然对于K-Means等算法，归一化是常见的实践，但在某些情况下，不进行归一化也可能得到合理的聚类结果。但是，如果特征的分布不同，归一化仍然可以提高算法的性能。一些基于决策规则的算法（如关联规则挖掘）不涉及特征的数值计算，而是基于特征的存在与否进行判断，因此尺度不会影响结果。

机器学习为什么使用归一化？有哪些归一化算法？

m0_51339444的博客

01-24

695

机器学习为什么使用归一化？有哪些归一化算法？

2 条评论您还未登录，请先登录后发表或查看评论

模型的数据归一化处理

qq_51713698的博客

07-25

1335

使用fashion_mnist数据建立一个模型，对数据进行归一化处理之后再放入模型中进行训练。不进行归一化的accuracy为0.83。进行归一化之后的accuracy为0.87。

机器学习哪些算法需要归一化？

我是天才很好

04-25

3312

机器学习中需要归一化的算法有SVM, 逻辑回归，神经网络，KNN, 线性回归，而树形结构的不需要归一化，因为它们不关心变量的值，而是关心变量分布和变量之间的条件概率，如决策树，随机森林，对于树形结构，树模型的构造是通过寻找最优分裂点构成的，样本点的数值缩放不影响分裂点的位置，对树模型的结构不造成影响，而且树模型不能进行梯度下降，因为树模型是阶跃的，阶跃是不可导的，并且求导没意义，也不需要归一化。 ...

深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用

最新发布

一个AI从业者的博客

03-02

1752

**归一化**（Normalization）是提升模型性能、加速训练的重要技巧。归一化方法可以帮助减少梯度消失或爆炸的问题，提升模型的收敛速度，且对最终模型的性能有显著影响。本文将以 PyTorch 为例，介绍4种常见的归一化方法：BatchNorm、Layer Norm、Instance Norm、Group Norm，并详细讲解它们的原理和公式。

机器学习-数据归一化及哪些算法需要归一化

qq_41978536的博客

04-23

5600

一、数据为什么需要归一化处理 归一化的目的是处理不同规模和量纲的数据，使其缩放到相同的数据区间和范围，以减少规模、特征、分布差异对模型的影响。方法： 1.极差变换法 2. 0均值标准化（Z-score方法） 1.Max-Min（线性归一化） Max-Min归一化是对原始数据进行线性变化，利用取值的最大值和最小值将原始数据转换为某一范围的数据缺点：归一化过程与最大值和最小值有关，容易受...

为什么要进行归一化，树模型为什么不需要归一化

Jasonluo8的博客

10-23

241

https://blog.csdn.net/rope_/article/details/107826059

树模型为什么不需要对数据进行归一化？

tangyaruo的博客

12-09

2026

因为数值缩放不影响分裂节点位置，对树模型的结构不造成影响。 树模型是按照特征值进行排序的，排序的顺序不变，那么所属的分支以及分裂点就不会有不同。而且，树模型是不能进行梯度下降的，因为构建树模型（回归树）寻找最优点时是通过寻找最优分裂点完成的，因此树模型是阶跃的，阶跃点是不可导的，并且求导没意义，也就不需要归一化。既然树形结构不需要归一化，那为何非树形结构比如线性模型则需要归一化呢？对...

机器学习之数据归一化

12-22

为什么需要进行数据归一化？举个简单的例子，样本1以[1, 200]输入到模型中去的时候，由于200可能会直接忽略到1的存在。此时样本间的距离由时间所主导。此时，如果将天数转换为占比1年的比例，200/365=0.5479, 100...

Python机器学习002：哪些机器学习算法不需要做归一化处理

若北辰

08-17

1789

需要归一化的模型： 1.基于距离计算的模型：KNN。 2.通过梯度下降法求解的模型：线性回归、逻辑回归、支持向量机、神经网络。不需要归一化的模型： 1.树模型：决策树、随机森林（Random Forest）树形模型不需要归一化，因为树模型并不关心变量的值，而是关心变量的分布和变量之间的条件概率。其实归一化和标准化主要是为了使计算更方便，比如两个变量的量纲不同，可能一个的数值远大于另一个，那么他们同时作为变量的时候可能会造成数值计算的问题，比如说求矩阵的逆可能很不精确或者梯度下降法的收敛

机器学习-数据归一化方法（Normalization Method）

热门推荐

Microstrong

11-26

10万+

我的个人微信公众号：Microstrong 微信公众号ID：MicrostrongAI 公众号介绍：Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容，分享在学习过程中的读书笔记！期待您的关注，欢迎一起学习交流进步！知乎专栏：https://zhuanlan.zhihu.com/Microstrong 个人博客：https://blog.csd...

树模型为什么不需要归一化

qq_33761777的博客

10-20

377

知乎面试专栏

模型特征工程：归一化

l491899327的博客

11-25

1086

特征归一化一、归一化二、归一化的常用方法三、为什么需要对数值型特征做归一化？一、归一化 为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理，使得不同指标之间具有可比性。例如，分析一个人的身高和体重对健康的影响，如果使用米（m）和千（kg）作为单位，那么身高特征会在1.6～1.8m的数值范围内，体重特征会在50～100kg的范围内，分析出来的结果显然会倾向于数值差别比较大的体重特征。想要得到更为准确的结果，就需要进行特征归一化。二、归一化的常用方法线性函数归一化（Mi

树形结构为什么不需要归一化？

weixin_48331187的博客

10-13

312

例如，在特征值差异较大或者特征的取值范围差异较大时，归一化可以帮助决策树更快地收敛和准确地找到最优的特征分割点。因此，尽管决策树等树形结构不要求归一化，但在实践中，对数据进行归一化仍然是一个良好的实践。3. 不受异常值影响：由于决策树基于特征的分割来进行决策，对于异常值的存在能通过特征的分割点来消除。2. 特征间的比较：在决策树的每个节点上，通过比较某个特征与阈值的关系，将数据分配到不同分支上。决策树和其他树形结构（如随机森林、梯度提升树等）在衡量特征之间的差异时是基于阈值的，而不是使用特征的绝对值。

解析大模型归一化：提升训练稳定性和性能的关键技术

秋声工作室

12-08

1482

大模型归一化是深度学习领域中的重要技术。通过选择合适的归一化方法和位置，可以显著提高模型的训练稳定性和性能。无论是BatchNorm、LayerNorm、RMSNorm还是DeepNorm，每种方法都有其独特的优势和适用场景。理解并合理应用这些归一化技术，将有助于构建更高效、更稳定的深度学习模型。

每日一题：树模型为什么不需要归一化？

Python学习与数据挖掘

12-17

1996

树模型为什么不需要归一化？参考答案树模型是找最佳分裂点，是否对数据进行归一化，不影响最佳分裂点的计算。此外，树模型是不进行梯度下降的，阶跃点是不可导的，并且求导没意义，也就不需要归一化。既然树形结构（如决策树、RF）不需要归一化，那为何非树形结构比如Adaboost、SVM、LR、Knn、KMeans之类则需要归一化呢？对于线性模型，特征

为什么树模型不需要对特征进行one-hot编码、归一化、或者woe编码等预处理呢？

u010569893的博客

01-02

6394

为什么树模型不需要对特征进行one-hot编码、归一化、和woe编码等预处理呢？ 1、树模型是要寻找最佳分裂点，对于离散特征，树模型会评估每个离散值的信息增益，将信息增益最大的数值作为分裂点，因此，树模型不需要对离散特征进行事先one-hot处理，否则会使特征维度增大且稀疏，不仅会增加模型的计算量，而且会损失数据的信息量造成模型的效果不佳，以及过拟合的风险。 2、对于连续型特征，树模型对尝试对连续...

归一化处理公式_树形结构为什么不需要归一化，树模型为什么是不能进行梯度下降...

weixin_39827306的博客

12-15

625

参考：树模型为什么是不能进行梯度下降blog.csdn.net七月在线：树形结构为什么不需要归一化？zhuanlan.zhihu.com概率模型不需要归一化，因为它们不关心变量的值，而是关心变量的分布和变量之间的条件概率，如决策树、rf。而像adaboost、svm、lr、KNN、KMeans之类的最优化问题就需要归一化。对于树形结构为什么不需要归一化？机器学习 ML基础易答：因为数值缩放不...

机器学习归一化需要归一化哪些数据

04-25

机器学习中的归一化通常需要对特征数据进行归一化处理。特征数据是指用于描述样本的各个属性或特征的数据。常见的特征数据包括数值型数据和类别型数据。在归一化中，主要对数值型数据进行处理，目的是将不同特征的...

哪些机器学习模型需要归一化

一、概率模型\树模型 不需要归一化

二、关心变量值、使用梯度下降的算法，需要归一化

三、汇总

一、概率模型\树模型不需要归一化