由adboost, gbdt到xgboost，从目标函数说起

最新推荐文章于 2023-05-07 16:05:26 发布

chencas

最新推荐文章于 2023-05-07 16:05:26 发布

阅读量1k

点赞数 1

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/chencas/article/details/102765266

版权

本文详细介绍了Adaboost、GBDT和XGBoost的原理，特别是它们的目标函数。Adaboost通过指数损失函数和基分类器权重更新样本权重。GBDT使用负梯度来拟合CART回归树，适用于各种损失函数。XGBoost则引入正则化项，优化二次目标函数，实现更高效训练。文章探讨了为何GBDT采用负梯度和XGBoost的分裂规则，并提及了回归和多分类问题的处理方法。

摘要由CSDN通过智能技术生成

Adboost

原理

Adboost是利用前一轮弱学习器的误差率来更新训练集的权重，这样一轮轮的迭代下去，简单的说是Boosting框架+任意基学习器算法+指数损失函数。它是加法模型，学习的是前向分布学习算法，损失函数为指数函数的分类问题；另外，其基分类器可以为任何学习器，使用最广泛的是决策树和神经网络；对于决策树，使用CART分类回归树

目标函数

损失函数为指数函数，即定义损失函数为：
$\underset{a,G}{ \underbrace{arg min}}\sum_{i=1}^mexp(-y_if_k(x)) ---（1）$
其中， $f_k(x)$ 为第k轮的学习器 $f_{k}(x) = \sum\limits_{i=1}^{k}\alpha_iG_{i}(x)$ , G(x)为基分类器， $\alpha$ 为每个基分类器的权重，m为样本数。
建立第k个基分类器时：
$(\alpha_k, G_k(x)) = \underbrace{arg\;min\;}_{\alpha, G}\sum\limits_{i=1}^{m}exp[(-y_i) (f_{k-1}(x) + \alpha G(x))] \\ = \underbrace{arg\;min\;}_{\alpha, G}\sum\limits_{i=1}^{m}w_{ki}'exp[-y_i\alpha G(x)]$
注意此时对于单个基分类器 $G_k(x)$ 而言，对任意的 $\alpha$ 有
$G_k(x) = \underbrace{arg\;min\;}_{G}\sum\limits_{i=1}^{m}w_{ki}'I(y_i \neq G(x_i)) --- （2）$
继续公式（adboost-1）

最低0.47元/天解锁文章

chencas

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
由adboost, gbdt到xgboost，从目标函数说起

Adboost原理Adboost是利用前一轮弱学习器的误差率来更新训练集的权重，这样一轮轮的迭代下去，简单的说是Boosting框架+任意基学习器算法+指数损失函数。它是加法模型，学习的是前向分布学习算法，损失函数为指数函数的分类问题；另外，其基分类器可以为任何学习器，使用最广泛的是决策树和神经网络；对于决策树，使用CART分类回归树目标函数损失函数为指数函数，即定义损失函数为：L=ar...
复制链接

扫一扫

专栏目录