【机器学习面试】（四）结合论文理解XGBoost推导过程

最新推荐文章于 2025-05-12 05:46:36 发布

Blank_spaces

最新推荐文章于 2025-05-12 05:46:36 发布

阅读量550

点赞数 3

文章标签：决策树算法机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Blank_spaces/article/details/114529122

版权

本文深入解析XGBoost的原理，基于论文详细阐述目标函数定义、梯度提升算法及决策树构造过程，探讨如何通过二阶导数近似损失函数并采用贪心算法构建最优决策树。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

XGBoost是一个可扩展的提升树模型，论文“XGBoost: A Scalable Tree Boosting System”发表在2016年的KDD会议上。文章包括了XGBoost的原理以及对其的优化。本文主要分享XGBoost的推导过程，包含论文内容2.1-2.2部分，这里假设你已掌握决策树、GBDT的相关知识。

本文约2.7k字，预计阅读10分钟。

XGBoost原理

XGBoost最关键的思想就是采用二阶导来近似取代一般损失函数。整个推导过程分为以下几个步骤（问题）：

目标函数的构造；
目标函数难以优化，如何近似？
将树的结构（参数化，因为模型的学习参数在树中）融入到目标函数；
如何构造最优（局部）二叉树？采用贪心算法；

目标函数定义

首先我们假设一个数据集中包含个样本以及每个样本有个特征，因此数据集可以定义为：

对于提升树模型来说，我们假设共有个叠加函数（additive functions，即决策树），那么整个模型可以表示为：

其中：

：表示模型对样本的预测值；
：模型函数；
：表示单个样本；
：表示第决策树；
；表示决策树的空间集合；

我们要学习上述集成模型函数（也称加法模型），则需要最小化正则化后的损失函数（即目标函数，正则化是对复杂决策树的惩罚）：

表示第个决策树的复杂度，这里我们先不去参数化和。

梯度提升算法

问题1： 对于上述的目标函数，其实很难在欧氏空间中使用传统的优化方法。

因此，提升树模型采用前向分步的学习方法。假设表示在第次迭代时对第个样本的预测，那么我们可以将目标函数转化为以下形式（这里假设你已掌握提升树算法的知识）：

其中，表示第

最低0.47元/天解锁文章

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。