XGBoost

最新推荐文章于 2021-02-24 11:38:28 发布

EntropyPlus

最新推荐文章于 2021-02-24 11:38:28 发布

阅读量335

点赞数

分类专栏：集成学习

本文链接：https://blog.csdn.net/u012759262/article/details/105150913

版权

集成学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1. 目标函数：

假设有XGBoost模型中由 $k$ 棵树组成，则可以预测值可以由K棵树的预测结果相加得出，第 $k$ 棵树模型表示为 $f_k(x)$ ：

1.1 树的复杂度

树模型的复杂度主要有以下三种：

叶子结点个数
树的深度
叶节点的值（假设预测值为1000，每棵树的值预测值在100到200之间，此时只需要10棵树左右，如果降低叶子结点的值，则需要更多的树拟合目标值。因此树的复杂度略有降低。）

2 目标函数的表示

叠加式训练，在构建第 $k$ 课树的时候，前 $k - 1$ 棵树是已知的。假设目前我们要构建第 $k$ 棵树，第 $j$ 棵树对样本 $x_i$ 的预测值记为 $f_j(x_i)$ ，前 $k - 1$ 棵树对样本 $x_i$ 预测值为 $\hat{y}_{(i)}^{k-1}$
在这里插入图片描述

现在要求最小的loss值

因为前 $k - 1$ 棵树的结果和复杂度已知，故当训练第 $k$ 棵树的样本时，我们最小化的目标为：

总结一下：我们的目标函数为：

2.1 泰勒函数近似目标函数

在这里插入图片描述

代入泰勒函数：

其中，红框中的部分均为已知部分，故而不参与后期的优化过程，

因此，最后的目标函数变为：

3. 如何参数化当前树的函数？

在这里插入图片描述
也就是，如何表示第 $i$ 个样本的表达式 $f_k(x_i)$ ？在此，需要定义几个变量：

叶节点的权重。
样本的位置 $q(x_i)$
如果样本落在第二个节点上，那么该值可以表达为 $w_2$ ，假设1,3 值落在节点1上；2,5 值落在节点3上；4落在2节点上，则可以表示为：

所以， $f_k(x_i)=w_{q(x_i)}$
为了去掉 $w_{q(x_i)}$ 中下标的函数，需要定义变量 $I_j$ ，表示第 $j$ 个节点中有哪些样本？
定义树的复杂度
树的复杂度 = 叶节点的个数 + leaf value，即：

$\lambda$ 和 $\gamma$ 代表不同复杂度项的惩罚力度。

$w_{q(x)}$ 的表示方法：

按照样本顺序：
按照叶节点的顺序：

所以，目标函数可以表示为：

其实就是一个一元二次函数的最值问题了，（T是叶节点的个数）：

接下来的问题就是，从所有可能的树结构中寻找一棵树，这棵树的obj*值最小。

4. 寻找树

在这里插入图片描述
在决策树中，我们的目标函数其实是entropy，但是在XGBoost中，目标函数其实就变成了Obj*。

假设目前树的形状为：
在这里插入图片描述

设下一步可能的划分为，以特征1构造下一个分支节点：
在这里插入图片描述

接下来遍历该子树下的所有特征，选出一个能够让 $obj_{new}^*-obj_{old}^*$ 最大的就行。

EntropyPlus

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
XGBoost

1. 目标函数：假设有XGBoost模型中由kkk棵树组成，则可以预测值可以由K棵树的预测结果相加得出，第kkk棵树模型表示为fk(x)f_k(x)fk(x)：1.1 树的复杂度树模型的复杂度主要有以下三种：叶子结点个数树的深度叶节点的值（假设预测值为1000，每棵树的值预测值在100到200之间，此时只需要10棵树左右，如果降低叶子结点的值，则需要更多的树拟合目标值。因此树的复...
复制链接

扫一扫

专栏目录