XGBoost算法模型

最新推荐文章于 2024-07-16 12:38:33 发布

s_daqing

最新推荐文章于 2024-07-16 12:38:33 发布

阅读量1.1k

点赞数 1

分类专栏： tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/s_daqing/article/details/118424605

版权

tensorflow 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

XGBoost：

目标函数=损失函数（拟合数据） + 正则化项（惩罚复杂模型）
在这里插入图片描述
误差函数尽量拟合训练数据，正则化项鼓励简单的模型

作用：用于控制树的复杂度，防止过拟合，使得模型更简化，也使得最终的模型的预测结果更稳定
在这里插入图片描述

目标函数：
在这里插入图片描述
对目标函数改进，进行二阶泰勒展开

分别定义gi和和hi为一阶导数和二阶导数

带入目标函数得：

继续推导

令Gj和Hj分别表示每个叶子节点的一阶梯度的和，与二阶梯度的和，如下

目标函数改写为：
在这里插入图片描述
我们希望这个值越小越好，那对w求偏导令偏导等于0：

求解得：

具体推导过程可参考：https://zhuanlan.zhihu.com/p/83901304

特点：

XGBoost将树模型的复杂度加入到正则项中，从而避免过拟合，泛化性能好
损失函数是用泰勒展开式展开的，用到了一阶导和二阶导，可以加快优化速度
在寻找最佳分割点时，采用近似贪心算法，用来加速计算
不仅支持CART作为基分类器，还支持线性分类器，在使用线性分类器的时候可以使用L1，L2正则化
支持并行计算，XGBoost的并行是基于特征计算的并行，将特征列排序后以block的形式存储在内存中，在后面的迭代中重复使用这个结构。在进行节点分裂时，计算每个特征的增益，选择增益最大的特征作为分割节点，各个特征的增益计算可以使用多线程并行
优点：速度快、效果好、能处理大规模数据、支持自定义损失函数等
缺点：算法参数过多，调参复杂，不适合处理超高维特征数据

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。