一文掌握XGBoost核心原理

最新推荐文章于 2023-04-24 16:35:26 发布

「已注销」

最新推荐文章于 2023-04-24 16:35:26 发布

阅读量558

点赞数

分类专栏：机器学习文章标签： xgboost 机器学习 gbdt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/github_35304705/article/details/89162588

版权

XGBoost是经典的提升树学习框架，其配套论文和PPT分享也相当经典，本文简单梳理其思路，原文见XGBoost原理简介。

整体思路

和一般提升模型一样，提升树模型也遵循相同的范式

采用加法模型「forward stage-wise manner」
每轮引入一weak learner「此处是一棵CART树」
学习之前weak learners的不足「用梯度表征」

同时要考虑过拟合等问题「overfitting is everywhere」。

Tree Ensemble

遵循李航老师统计学习三要素公式

$方法 = 模型 + 策略 + 算法$

假设空间「模型」

Tree Ensemble基本思想是将多棵树的结果融合作为最终输出，示意图如下

paper-xgboost-tree-ensemble

不难看出，模型的假设空间是一系列CART树的集成，输出为

$\hat y_i = \sum_{k=1}^{K} f_k(x_i), \quad f_k \in F$

其模型参数为 $K$ 颗树

$\circleddash = \{f_1, f_2, \dots, f_K\}$

目标函数「策略」

模型假设有了，另一个核心元素就是目标函数，和一般监督模型一样

$Obj(\circleddash)=L(\circleddash)+\Omega(\circleddash)$

目标函数分两部分「Bias-variance tradeoff is everywhere」

Training Loss measures how well model fit on training data
Regularization measures complexity of model

具体到Tree Ensemble，其目标函数为

$\sum_{i=1}^{n} l(y_i, \hat y_i) + \sum_{k=1}^{K}\Omega(f_k)$

优化求解「算法」

模型参数的最终求解。参数 $\circleddash = \{f_1, f_2, \dots, f_K\}$ 为 $K$ 颗树，无法用SGD类似方法优化求解，因为不是 $R^d$ 空间上的数值向量。一般采用Additive Training(Boosting)的思想求解。

Gradient Boosting

Tree Ensemble章节回答了what we are learning的问题，Gradient Boosting章节要回答how do we learn的问题。

Additive Traing范式

采用Additive Training(Boosting)的模式，即每一轮学习一颗新树 $f_t$

paper-xgboost-boosting

学习一颗新树

问题是每一轮 $\hat y_i^{(t)} = \hat y_i^{(t-1)} + f_t(x_i)$

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
一文掌握XGBoost核心原理

XGBoost是经典的提升树学习框架，其配套论文和PPT分享也相当经典，本文简单梳理其思路，原文见XGBoost原理简介。整体思路和一般提升模型一样，提升树模型也遵循相同的范式采用加法模型「forward stage-wise manner」每轮引入一weak learner「此处是一棵CART树」学习之前weak learners的不足「用梯度表征」同时要考虑过拟合等问题「ove...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。