集成学习 | 集成学习思想：Boosting思想 | XGBoost算法、LightGBM算法

最新推荐文章于 2025-08-30 16:45:00 发布

原创

最新推荐文章于 2025-08-30 16:45:00 发布 · 1.8k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#集成学习 #boosting #算法 #XGBoost #LightBGM

本文介绍了基于Boosting思想对GBDT改进的两种算法。XGBoost能更高效训练模型，其损失函数在GBDT基础上增加正则化项，通过二阶展开求最优解，还介绍了计算增益和特征选择方法；LightGBM由微软开发，能处理大规模数据，采用直方图离散化特征。

一. XGBoost 算法

XGBoost是GBDT(梯度提升树)的一个改进版本
能够更快的、更高效率的训练模型
X代表的就是eXtreme（极致）

	学习器：
		决策树
		将这些决策树称为”弱学习器“，这些”弱学习器“共同组成了XGboost
	算法思想：
		XGBoost的决策树之间是有先后顺序
		后一棵决策树的生成会考虑前一棵决策树的预测结果，即：将前一棵决策树的偏差考虑在内，也就是更改y值
	数据使用：
		生成每棵决策树使用的是整个数据集

在这里插入图片描述

1. XGBoost 算法流程

构造初始化常数函数，以及模型跟新
$F_{0}(x)=f_{0}(x)=0$

$F_{1}(x)=F_{0}(x)+f_{1}(x)$

$F_{2}(x)=F_{1}(x)+f_{2}(x)$

$......$

$F_{0}(x)=F_{(k-1)}(x)+f_{k}(x)$

我们的目标为：求出函数 $f_{1}(x)$ ， $f_{2}(x)$ ，…， $f_{k}(x)$
定义损失函数
XGBoost算法的损失函数：在GBDT的基础上增加了正则化项，用于限制模型的复杂度
$j=\sum_{i=1}^{n} L\left(y_{i}, F_{i}^{(k)}(x)\right)+\sum_{i=1}^{k} \Omega\left(f_{i}\right)$

公式解释：

$o bj 函数$ 为构建 $k$ 棵树的总损失

预测误差 + 每棵树复杂度的惩罚项

对于正则化项，我们做出以下公式优化：
$f_{k}(x)=w_{q(x)}$
$\Omega(f)=\gamma T+\frac{1}{2} \lambda \sum_{j=1}^{T} w_{j}^{2}$

公式解释：
$f_{k}(x)$ 可以表示一棵树

f 是一棵决策树， $f_{k}$ 是第 $k$ 棵决策树
x 是一个样本，丢进 $f 函数$ 中就需要对该样本进行预测
$q (x)$ 表示进入的样本x落在哪个叶子节点中
$w_{q(x)}$ 是叶子节点 $q (x)$ 的值

先算在哪个叶子节点上，然后根据该叶子节点的值返回

$\Omega(f)$ 可以表示一棵树的复杂程度

T 表示这棵决策树叶子节点的数量：叶子节点越多，决策树越复杂
$w_{j}^{2}$ 表示所有叶子节点值的平方和

$w$ 为叶子节点的值
由于每个弱学习器拟合的都是残差，所以 $w$ 不能太大
如果模型企图去拟合离群点，那么 $w$ 就会变大

此时，目标函数可以写为
$L^{k}=\sum_{i=1}^{n} L\left[y_{i}, F_{k-1}(x)+f_{k}\left(x_{i}\right)\right]+\sum_{j=1}^{K} \Omega\left(f_{j}\right)$

公式推导：

$L^{k}$

$=\sum_{i=1}^{n} L\left[y_{i}, F_{k-1}(x)+f_{k}\left(x_{i}\right)\right]+\sum_{j=1}^{K} \Omega\left(f_{j}\right)$