GBDT算法 Gradient Boosting Decision Tree
以梯度为优化目标,以提升为手段(前面讲到的集成算法中的串联),基础模型为决策树(这里用的是回归树)的算法
GBDT简单来说,就是用多个树串联,提升模型的效果
以下是学习唐宇迪老师的GBDT算法的理解,文末有其他直接更详细的的关于GBDT算法的实现
回归树的形式是CART 即二叉树
使用回归树做分类和回归都可以
我们希望分类的话是残差尽量小,使损失函数小,而回归,数据离均值近
衡量回归树分类效果我们用的是利用变换到exp函数上属于哪一类的概率从而得到损失函数的值
衡量回归树回归效果我们用的是最小二乘法,实际值和均值之差的平方累和
GBDT核心为GB算法,它的优化目标是使损失函数最小
f(x)即为我们建立的模型,L函数是损失函数,意思是什么样的模型能够使得到损失函数最小(数据得到合理分配)
那么对于GBDT算法来说,就是找到合理的参数(模型的参数和各模型的合理的分配比例,因为这里用到的是多棵树)
因