GDBT

最新推荐文章于 2022-10-12 20:47:25 发布

dabingsun

最新推荐文章于 2022-10-12 20:47:25 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习调参优化

本文链接：https://blog.csdn.net/dabingsun/article/details/105074471

版权

机器学习同时被 2 个专栏收录

14 篇文章 1 订阅

订阅专栏

调参优化

8 篇文章 0 订阅

订阅专栏

3. RF(随机森林)与GBDT之间的区别与联系

GDBT

GDBT(gradient boosting decision tree)：全名为梯度提升树，内部子树为CART树，基于Boosting集成思想提出的。

参考详解发现优质的开源项目（经典的各种ML、DL方法）

1概念:

GBDT的原理很简单，就是所有弱分类器的结果相加等于预测值，然后下一个弱分类器去拟合误差函数对预测值的残差(这个残差就是预测值与真实值之间的误差，在使用MSE时，)。当然了，它里面的弱分类器的表现形式就是各棵树。

举一个非常简单的例子，比如我今年30岁了，但计算机或者模型GBDT并不知道我今年多少岁，那GBDT咋办呢？

它会在第一个弱分类器（或第一棵树中）随便用一个年龄比如20岁来拟合，然后发现误差有10岁；
接下来在第二棵树中，设置当前预测值为10岁，用当前树用拟合10岁，发现差距还有4岁；
接着在第三棵树中拟合残差4岁，发现差距只有1岁了；
最后在第四课树中用1岁拟合剩下的残差，完美。
最终，四棵树的结论加起来，就是真实年龄30岁（实际工程中，gbdt是计算负梯度，用负梯度近似残差）。

为何gbdt可以用用负梯度近似残差呢？

回归任务下，GBDT 在每一轮的迭代时对每个样本都会有一个预测值，此时的损失函数为均方差损失函数，

那此时的负梯度是这样计算的

所以，当损失函数选用均方损失函数是时，每一次拟合的值就是（真实值 - 当前模型预测的值），即残差。此时的变量是y'，即“当前预测模型的值”，也就是对它求负梯度。在神经网络中梯度优化是以具体参数更细为代表，而在GDBT中，是以树这种模型空间代替参数来进行更新的。

注意：GBDT做分类时，每一次迭代需要有k棵树，k是类别数目，每棵树对一个类别进行预测。每个叶子节点也只是输出一个值，可把这颗树看作一个函数f，f将输入样本的特征映射为该值。（注意，该值并不是类别的概率，概率还需要一个logistic转化，logistic regression是：特征x先转化成实值z，然后z经过logistic regression转化成概率p(x)，这里叶子节点的值相当于z）。

2. GBDT的优点和局限性有哪些？