提升树算法

这篇博文主要参考了李航《统计学习方法》与论文:GREEDY FUNCTION APPROXIMATION:
A GRADIENT BOOSTING MACHINE。这里简单记录下对提升树的简单理解。
1、梯度提升算法
有关梯度提升算法的细节请参考上述论文,这里直接贴出梯度提升算法的过程:
这里写图片描述
简单谈谈对该算法的理解:第三行表示组合模型为Fm-1时,下一步迭代的最速下降方向。第四行表示弱分类器对下降方向的拟合,从而把数据空间中的优化转化为函数空间中的优化问题;第五步是优化的线性搜索;第六步更新模型。具体而言,损失函数有平方损失、绝对值损失、对数损失等不同的损失函数,这里简单说下平方损失与对数损失。
2、Least-squares regression
这里损失函数为L(y,F)=(y-F)^2/2,对应的算法如图所示:
这里写图片描述

算法2中弱分类器拟合前面模型与真实值差(残差)

3、提升树算法
提升方法实际上采用加法模型与前向分步算法,以决策树为弱分类器的提升方法称为提升树。回归树提升树使用以下的前向分布算法:
这里写图片描述
可以看出,在求下一棵树的过程中,只需要对残差拟合就可以了。
4、Two-class logistic regression and classification
如果损失函数是平方损失函数的时候,残差是比较容易计算的。在不断拟合残差的过程中使得组合模型能够越来越好的拟合训练数据。但是对其他形式的损失函数每一步的优化并不简单。Freidman提出用当前模型的负梯度作为残差近似值,拟合一颗回归树。举例来说,如下损失函数的梯度求解:
这里写图片描述
有了残差的近似值就可以进行下面的拟合,进而得到最终的组合模型了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值