XGBoost

最新推荐文章于 2024-08-17 11:24:13 发布

YaoTian_ml

最新推荐文章于 2024-08-17 11:24:13 发布

阅读量135

点赞数

分类专栏：一些理解和笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28012985/article/details/90822957

版权

一些理解和笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

XGBoost算法和GBDT的不同在于两个方面，一是在损失函数中表示树的复杂度的正则项，二是不同于GBDT采用损失函数关于树的负梯度作为残差的近似，XGBoost则在梯度基础上增加了二阶项作为损失函数的近似。

提升树更新：

损失函数可以写成：

对在处进行泰勒二阶展开：

其中gi为，hi为

展开为了得到近似的损失函数，损失函数是关于的函数，为之前模型的损失，与无关，所以近似的损失函数为后面三项之和。这里也可以看出对于GBDT来说，只考虑了一阶导数项，是关于损失函数的一阶近似，而XGBoost是采用的是关于损失函数的二阶近似，会更快收敛。

正则项：

正则项第一项为叶节点数量，第二项为叶子节点对应的值，叶子节点尽量少且值尽量小，保证值数量少而集中，减少潜在的树层次，提高精度以及计算速度？

对于一个确定结构的回归树来说，可以求得损失最小的情况下的最优回归值：

此时的最小损失为：

回归树的构建策略：

确定最优的树结构是NP难问题，所以不能通过先确定树结构再来求解最优回归值的方式，只能还是用贪心法，不一样的是衡量分裂节点前后的增益计算有所不同，采用打分函数：

考虑最小损失函数中的每个叶子对总体损失的贡献部分，这部分越大损失函数越小，这部分越小，损失函数越大，所以只有在这部分的值变大时，才是值得分裂的，假设选定了节点的某一个位置进行分裂，分成左边一部分，右边一部分。

Gain值越大，说明这一节点越值得分裂，遍历所有的特征/变量，计算对应的Gain，选择Gain值最大的进行分裂，分裂成多部分时，在计算Gain时要每次针对分裂点，看成两部分，从而得到多个gain值

树节点的分裂方法：

暴力枚举：遍历所有特征的所有可能的分割点，计算gain，找到最大的点去分割；
近似方法：对于每个特征，只考虑几个特定的分位点，从而减少计算量；
二阶导数（XBGoost）：以二阶导数值作为参考划分点，因为二阶导数对损失函数有加权作用，所以二阶导数变化比较大时，损失函数变化也比较大，以变化较大的点作用切分点，切分形成区域内比较平稳，适合推选出回归值；
直方图算法（LightGBM）；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

YaoTian_ml CSDN认证博客专家 CSDN认证企业博客

码龄9年

9: 原创

113万+: 周排名

164万+: 总排名

2万+: 访问

: 等级

299: 积分

3: 粉丝

7: 获赞

3: 评论

35: 收藏

私信

关注

热门文章

分类专栏

最新评论

win10+mx150深度学习GPU加速
Lindun想要学语音: 哈哈，我是小米air i5用户，MX150玩不了GTA4但是可以跑简单的网络，也算是不浪费这块卡了。
win10+mx150深度学习GPU加速
飞天牛牛: 哈哈哈原来 MX150 还是可以的嘛这周keras 走起
win10+mx150深度学习GPU加速
YaoTian_ml 回复 pb456: 手写字体样本学习一下还是可以跑，玩深度学习的话还是需要一个桌面级显卡1060及以上吧
win10+mx150深度学习GPU加速
csdn_yuan88: 棒棒哒
win10+mx150深度学习GPU加速
SimZhou: 可以啊！比起cpu来说还是要强不少！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。