树模型为什么不需要对数据进行归一化？

最新推荐文章于 2023-09-22 14:29:36 发布

吴彦蛆

最新推荐文章于 2023-09-22 14:29:36 发布

阅读量1.9k

点赞数 2

文章标签：机器学习

本文链接：https://blog.csdn.net/tangyaruo/article/details/103458618

版权

因为数值缩放不影响分裂节点位置，对树模型的结构不造成影响。

树模型是按照特征值进行排序的，排序的顺序不变，那么所属的分支以及分裂点就不会有不同。而且，树模型是不能进行梯度下降的，因为构建树模型（回归树）寻找最优点时是通过寻找最优分裂点完成的，因此树模型是阶跃的，阶跃点是不可导的，并且求导没意义，也就不需要归一化。

既然树形结构不需要归一化，那为何非树形结构比如线性模型则需要归一化呢？

对于线性模型，特征值差别很大时，比如说LR，我有两个特征，一个是(0,1)的，一个是(0,10000)的，运用梯度下降的时候，损失等高线是椭圆形，需要进行多次迭代才能到达最优点。但是如果进行了归一化，那么等高线就是圆形的，促使SGD往原点迭代，从而导致需要的迭代次数较少。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

吴彦蛆

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

机器学习为什么使用归一化？有哪些归一化算法？

m0_51339444的博客

01-24

618

机器学习为什么使用归一化？有哪些归一化算法？

为什么决策树相关的算法不需要标准化？那么那些模型需要标准化那？

data+scenario+science+insight

06-24

4220

参与评论您还未登录，请先登录后发表或查看评论

6.项目中的数据是否会归一化处理，哪个机器学习算法不需要归一化处理？

ayu96777的博客

06-13

5295

6.项目中的数据是否会归一化处理，哪个机器学习算法不需要归一化处理？答：归一化的目的是处理不同规模和量纲的数据，时期缩放到相同的数据区间和范围，以减少规模、特征、分布差异对模型的影响。Max-Min（线性归一化）Max-Min归一化是对原始数据进行线性变化，利用变量取值的最大值和最小值将原始数据转换为某一范围的数据。缺点是尤其其归一化过程仅与该变量的最大值和最小值有关，容易受到极端取值的影响。会...

树模型为什么不需要归一化

qq_33761777的博客

10-20

357

知乎面试专栏

为什么要进行归一化，树模型为什么不需要归一化

Jasonluo8的博客

10-23

218

https://blog.csdn.net/rope_/article/details/107826059

为什么树模型不需要对特征进行one-hot编码、归一化、或者woe编码等预处理呢？

u010569893的博客

01-02

6267

为什么树模型不需要对特征进行one-hot编码、归一化、和woe编码等预处理呢？ 1、树模型是要寻找最佳分裂点，对于离散特征，树模型会评估每个离散值的信息增益，将信息增益最大的数值作为分裂点，因此，树模型不需要对离散特征进行事先one-hot处理，否则会使特征维度增大且稀疏，不仅会增加模型的计算量，而且会损失数据的信息量造成模型的效果不佳，以及过拟合的风险。 2、对于连续型特征，树模型对尝试对连续...

归一化处理公式_树形结构为什么不需要归一化，树模型为什么是不能进行梯度下降...

weixin_39827306的博客

12-15

599

参考：树模型为什么是不能进行梯度下降blog.csdn.net七月在线：树形结构为什么不需要归一化？zhuanlan.zhihu.com概率模型不需要归一化，因为它们不关心变量的值，而是关心变量的分布和变量之间的条件概率，如决策树、rf。而像adaboost、svm、lr、KNN、KMeans之类的最优化问题就需要归一化。对于树形结构为什么不需要归一化？机器学习 ML基础易答：因为数值缩放不...

验证系列-机器学习中，为什么要进行数据标准化或者归一化？

weixin_44700798的博客

12-09

3905

机器学习中，为什么要进行数据标准化或者归一化？应用条件原理分析实例佐证应用条件我们在翻阅各种资料时，在数据预处理步骤，经常会看到对数据进行标准化或者归一化，那么这么做的好处是什么？ 1、这样处理后加快了梯度下降求最优解的速度； 2、有可能提高精度；但是，理解这句话后，你会发现，这是有应用条件的，即： 1、适用于用梯度下降法求参数的算法； 2、适用于基于距离的算法；比如树模型这种基于概率的，是没有作用的。原理分析 1、为什么这样处理后加快了梯度下降求最优解的速度？原因很简单，比如我们有这样一个2元

1、为什么要经常对数据做特征归一化

qq_40212975的博客

02-11

1189

特征归一化

树形结构为什么不需要归一化？

七月在线实验室

04-30

4141

树形结构为什么不需要归一化？解析：因为数值缩放不影响分裂点位置，对树模型的结构不造成影响。按照特征值进行排序的，排序的顺序不变，那么所属的分支以及分裂点就不会有不同。而且...

为什么要对数值类型的特征做归一化，树形算法为啥不需要归一化？

Jiashilin

09-10

1340

百题突击2:1.在模型评估过程中，过拟合和欠拟合具体指什么现象 2.降低过拟合和欠拟合的方法 3.L1和L2正则先验分别服从什么分布 4.对于树形结构为什么不需要归一化？

MrCharles在CSDN

04-08

1055

文章目录1.在模型评估过程中，过拟合和欠拟合具体指什么现象2.降低过拟合和欠拟合的方法3.L1和L2正则先验分别服从什么分布4.对于树形结构为什么不需要归一化？ 1.在模型评估过程中，过拟合和欠拟合具体指什么现象过拟合（overfitting）指的是模型在训练数据是表现非常好，但是在验证集上表现特别差。欠拟合（underfitting）指的是是模型在训练数据和验证集上表现都比较差。 2.降低过拟合和欠拟合的方法降低过拟合的方法：减少特征的数量，你可以选择一下那些特征要使用，那些要丢弃，防止用太

每日一题：树模型为什么不需要归一化？

Python学习与数据挖掘

12-17

1893

树模型为什么不需要归一化？参考答案树模型是找最佳分裂点，是否对数据进行归一化，不影响最佳分裂点的计算。此外，树模型是不进行梯度下降的，阶跃点是不可导的，并且求导没意义，也就不需要归一化。既然树形结构（如决策树、RF）不需要归一化，那为何非树形结构比如Adaboost、SVM、LR、Knn、KMeans之类则需要归一化呢？对于线性模型，特征

哪些机器学习模型需要归一化

小白tree的博客

05-10

3928

归一化是对连续特征来说的。那么连续特征的归一化，起到的主要作用是进行数值缩放。数值缩放的目的是解决梯度下降时，等高线是椭圆导致迭代次数增多的问题。

为什么一些机器学习模型需要对数据进行归一化？

weixin_30706507的博客

04-20

1516

为什么一些机器学习模型需要对数据进行归一化？ http://www.cnblogs.com/LBSer/p/4440590.html 机器学习模型被互联网行业广泛应用，如排序（参见：排序学习实践）、推荐、反作弊、定位（参见：基于朴素贝叶斯的定位算法）等。一般做机器学习应用的时候大部分时间是花费在特征处理上，其中很关键的一步就是对特征数据进行归一化，为什么要归一化呢？很多同学并未搞清楚，...

机器学习-决策树总结

Mark_Australia的博客

05-18

958

决策树：LR模型是把所有特征塞入学习，而决策树类似if-else一样，去做条件判断。信息熵越低，纯度越高。信息熵计算：信息增益：划分前的信息熵 - 划分后的信息熵。表示的是向纯度方向迈出的“步长”。 ID3：在根节点处计算信息熵，根据属性依次划分并计算其节点的信息熵，信息增益降序排列，排在前面的就是第一个划分属性，其后依次类推，这就得到了决策树的形状。信息增益有一个问题：对可取值数目较多的属性有所偏好，例如：考虑将“编号”作为一个属性。 C4.5：使用信...

为什么决策树相关的算法不需要标准化？那么哪些模型需要标准化呢？

最新发布

EbCoder的博客

09-22

395

决策树算法基于特征的划分来进行决策，而不依赖于特征的具体数值。由于决策树的划分依据是基于特征的相对大小关系，因此决策树算法不受特征数值变化的影响，不需要进行标准化处理。决策树相关的算法不需要标准化的原因在于其基于特征的相对大小关系进行划分，不受特征数值变化的影响。下面我将详细解释决策树算法不需要标准化的原因，并介绍其他模型中需要进行标准化处理的情况。在逻辑回归中，特征的数值范围会影响模型的收敛速度和稳定性，所以需要进行标准化处理。在SVM中，特征的尺度影响着最大间隔超平面的确定，因此需要对数据进行标准化。

3、树形结构为什么不需要归一化？

做一个快乐学习者

06-16

1309

因为数值缩放不影响分裂点位置，对树模型的结构不造成影响。按照特征值进行排序的，排序的顺序不变，那么所属的分支以及分裂点就不会有不同。而且，树模型是不能进行梯度下降的，因为构建树模型（回归树）寻找最优点时是通过寻找最优分裂点完成的，因此树模型是阶跃的，阶跃点是不可导的，并且求导没意义，也就不需要归一化。既然树形结构（如决策树、RF）不需要归一化，那为何非树形结构比如Adaboost、SVM、LR、Knn、KMeans之类则需要归一化呢？对于线性模型，特征值差别很大时，比如说LR，我有两个特征，一个是

基于决策树的adaboost网络需要对输入的数据进行归一化吗？

06-13

在基于决策树的Adaboost算法中，对输入数据进行归一化可以提高算法的准确性和收敛速度，因为归一化可以使得不同特征之间的数值范围一致，避免了某些特征对模型训练的影响过大，从而提高了模型的稳定性和泛化能力。但是，是否需要对数据进行归一化也取决于具体的数据集和算法实现，以下两种情况可能不需要进行数据归一化： 1. 数据集中所有特征的数值范围已经一致，例如特征都是二元特征或者百分比值。 2. 使用了模型或者算法本身就对数据进行了归一化，例如使用了神经网络等模型。总之，是否需要对数据进行归一化需要具体问题具体分析，可以根据实验结果来决定是否需要进行数据归一化。