xgboost 原论文精读原理推导 + sklearn参数讲解

最新推荐文章于 2022-11-17 17:00:28 发布

统计分析分析

最新推荐文章于 2022-11-17 17:00:28 发布

阅读量498

点赞数 1

分类专栏：模型综述文章标签： xgooost sklearn

本文链接：https://blog.csdn.net/qq_36303521/article/details/88189427

版权

本文详细解读XGBoost的梯度提升树，包括正则化目标函数、分裂算法以及sklearn中的参数设置。重点介绍了正则化在防止过拟合中的作用，以及shrinkage和列采样技术。同时，讨论了不同分裂算法的优缺点，并对sklearn中的关键参数进行了详细解释，如max_depth、learning_rate和subsample等。

摘要由CSDN通过智能技术生成

梯度提升树

现在站在大神的角度来回顾一下梯度提升树

正则化的目标函数

给定训练集D，含有n个样本m个特征

一个含有k棵树的集成模型
在这里插入图片描述

F当然就是回归决策树的空间啦。q是每棵树的结构，T是每个树的叶子数量。每棵树都有独立的树结构q以及叶子权重w。不同于决策树，每个回归树的叶子都包含了一个连续的分数，我们使用w同表示这个叶子的分数。举个例子来说，我们将使用给定树的决策规则来分类为叶子。那么最终的预测结果可以通过计算加总相对应叶子的分数来获取。
在这里插入图片描述
这个图在网上经常看到，但是很少人能够解释得清楚。应该这样理解，对于每个样本来说，依次放入不同的回归树中，看它最后落入哪个叶子里面。对每个的回归树中的对应叶子的分数进行加总最后得到的结果就是整个函数对应的预测。那为什么在这个图中，第一棵树是2呢，因为这个是加法模型，第一模型通常预测的分数比较大。

为了学到每个回归树模型，使用下面这个目标函数。在这里插入图片描述
很自然，目标函数=损失函数+正则项
原文说，正则项是用来平滑最终的叶子权重的以此避免过拟合。直观上，正则化目标倾向于选择一个使用简单的具有预测性的函数的模型。RGF已经在使用一个简单的正则化技术了。本文使用的目标函数以及相对应的算法比RGF更简单以及易于并行化。当正则化参数为零，那么目标函数退化为梯度提升树。