GBDT——学习笔记

最新推荐文章于 2020-09-21 12:13:24 发布

吃辣椒的猪

最新推荐文章于 2020-09-21 12:13:24 发布

阅读量349

点赞数

本文链接：https://blog.csdn.net/qq_34806485/article/details/81114133

版权

本文是关于GBDT的学习笔记，主要解释了GBDT中的决策树、提升和梯度概念。GBDT使用回归树处理平方误差，通过构建多棵树不断减少训练数据的残差，从而提高预测准确性。每棵树的构建是根据前一棵树的残差进行优化，确保误判数据能得到关注。

摘要由CSDN通过智能技术生成

GBDT(梯度提升决策树)

看了一篇博客，觉得讲解得比较好，本文只是我的一篇笔记，主要是为了检验自己是否真的懂了。要看详细讲解，推荐参考https://blog.csdn.net/w28971023/article/details/8240756
按照博客中的介绍，对GBDT中的名词逐个进行解释。
-决策树
-提升
-梯度

决策树

一般听到决策树都会想到分类问题，如ID3，C4.5 ，计算信息增益；但是此处的决策树是回归树，构建回归树时，计算所有特征的所有取值后的平方误差（如特征A1，取值q1，则平方将c<=q1,分为一类，将c>q1分为另一类，将同一类中的所有取值的平均值作为预测值cm，用真实值与预测值的平方误差决定特征和值的选择）。
还是引用上述链接博客中的图，当每个叶节点就一个值，或是满足某一预设条件时，停止，得到回归树。
这里写图片描述

提升

一般提到boost(提升)，就会想到AdaBoost, 但是此处也有不同。上述回归树，为了使得训练误差最小，常常出现过拟合的情况。而GBDT，利用多个决策树的结果相加求预测值，如下图，
先构造第1棵回归树，得到训练数据集的残差（如14被分到了15的节点上，即预测残差为14-15=-1），然后对残差构造回归树（右边），如此循环，直到叶节点残差为0，或者达到预设阈值。这样，最终的预测值为所有回归树的叶节点之和（如A=15-1=14；B=15+1=16）.
这里写图片描述