高级算法 GBDT算法梳理

本文详细介绍了GBDT算法,从前向分布算法和负梯度拟合的原理,到损失函数的种类,再到回归问题、二分类、多分类的讨论,并探讨了正则化的角色和GBDT的优缺点。同时提到了GBDT在sklearn中的参数设置及应用场景,适合对机器学习感兴趣的读者深入理解GBDT。
摘要由CSDN通过智能技术生成

1、前向分布算法

      统计学习方法

      

     (假设为树模型)b(x;y)为基函数,使上棵树的预测值与真实值损失函数最小时得到的系数β和γ,其中γ是基函数中特征的权重向量,β为当前树的权重,向前累加基函数,得到当前模型的函数f(x),依次训练直到m的预设值。

2、负梯度拟合

      用损失函数的负梯度来拟合本轮损失的近似值,进而拟合一个CART回归树。

      

      利用(xi,rti)(i=1,2,..m)(xi,rti)(i=1,2,..m),我们可以拟合一颗CART回归树,得到了第t颗回归树,其对应的叶节点区域Rtj,j=1,2,...,JRtj,j=1,2,...,J。其中J为叶子节点的个数。

   针对每一个叶子节点里的样本,我们求出使损失函数最小,也就是拟合叶子节点最好的的输出值ctjctj如下(叶子区域最好的拟合值):

    

    本轮的决策树

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值