【机器学习基础】XGBoost公式推导

最新推荐文章于 2024-04-21 16:29:48 发布

Tuzi_bo

最新推荐文章于 2024-04-21 16:29:48 发布

阅读量1k

点赞数 1

分类专栏：机器学习文章标签：机器学习 XGBoost GBDT BDT

本文链接：https://blog.csdn.net/u010834867/article/details/93211009

版权

XGBoost是Boosting算法的一种，它通过结合多棵决策树形成强分类器。本文从Boosting基础，包括加法模型和前向分步算法，深入讲解BDT、GBDT，最后详细阐述了XGBoost如何在GBDT基础上引入正则化和二阶泰勒展开以防止过拟合并提高精度。

摘要由CSDN通过智能技术生成

XGBoost是Boosting算法的一种，Boosting算法的核心思想就是将许多基模型加在一起，形成一个强分类器。XGBoost就是将许多的CART树结合在一起，对于那些一颗树无法很好拟合的数据用多颗CART树不断地去逼近。本文从Boosting方法-->BDT(提升树)-->GBDT(梯度提升树)-->XGBoost的脉络来描述XGBoost.

一 Boosting

Boosting方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个基函数系列,然后以一定的方式将他们组合成一个预测函数。所以Boosting是一系列算法，其中包含AdaBoost，GradientBoosting，LogitBoost等算法。Boosting算法有两个重要的要素：加法模型和前向分步算法。

1.1 加法模型

加法模型可以表达成如下的形式：

$f(x)=\sum_{m=1}^{M}\beta_mb(x;\theta_m)$

其中， $b(x;\theta_m)$ 表示基模型，表示样本集， $\theta_m$ 表示基模型的参数， $\beta$ 表示基模型的系数。如果要能够应用加法模型，则要求这个选取的基模型是要可加的，一般来说我们会选择树模型或者线性模型来作为基模型，不太适合选取较复杂的模型。既然有了模型的表达式，那么要构造模型，只需要给出经验风险然后极小化经验风险即可，经验风险最小化可以表达为如下形式：

$\underset{\theta,\beta}{min}\sum_{i=1}^{N}L(y_i,\sum_{m=1}^{M}\beta_mb(x_i;\theta_m))$

从上面这个式子可以看出，要求得极小值还是比较复杂的，因为L中还有一个求和函数，所以这个时候引入前向分步算法来转换成迭代的方式来一步步的逼近最优值。前向分步算法的基本思想：从一个最基础的基模型开始，逐步优化，每次学习只学习一个基函数及其系数，逐步逼近上述目标函数，具体的，每一步只需要优化如下：

$min\sum_{i=1}^{N}L(y_i,\beta b(x_i;\theta))$

1.2 前向分步算法

前向分步算法的伪代码如下：

算法 1. 前向分步算法

输入：训练集 $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)\}$ ，其中 $x\in R^n,y \in R$ ，损失函数，基函数集合 $\{b(x;\theta)\}$

输出：加法模型 $f(x)=\sum_{m=1}^{M}\beta_m b(x;\theta_m)$

第1步：构造初始模型

第2步：对于 $m=1,2,\cdots,M$

1.构造每一步迭代的损失函数

$L(y,f(x))=\sum_{i=1}^{N}L(y_i,f_{m-1}(x)+\beta b(x_i;\theta))$

2.极小化损失函数

$(\beta_m,\theta_m)=argmin\sum_{i=1}^{N}L(y_i,f_{m-1}(x)+\beta b(x_i;\theta))$

3.更新当前模型

$f_m(x)=f_{m-1}(x)+\beta_mb(x;\theta_m)$

最低0.47元/天解锁文章

Tuzi_bo

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
【机器学习基础】XGBoost公式推导

XGBoost是Boosting算法的一种，Boosting算法的核心思想就是将许多基模型加在一起，形成一个强分类器。XGBoost就是将许多的CART树结合在一起，对于那些一颗树无法很好拟合的数据用多颗CART树不断地去逼近。本文从Boosting方法-->BDT(提升树)-->GBDT(梯度提升树)-->XGBoost的脉络来描述XGBoost.一 BoostingB...
复制链接

扫一扫

专栏目录