XGboost

最新推荐文章于 2021-06-25 13:23:56 发布

wrany

最新推荐文章于 2021-06-25 13:23:56 发布

阅读量187

点赞数

分类专栏：秋招准备

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38824043/article/details/106696429

版权

秋招准备专栏收录该内容

8 篇文章 0 订阅

订阅专栏

什么是XGboost

XGboost本质上还是GBDT，两者都是Boosting方法

XGboost 和 GBDT的主要区别是目标函数的定义

XGboost的目标函数是

$\large obj^{(t)} = \sum_{i=1}^{n}l(y_i, \hat{y_i}^{(t-1)} + f_t(x_i)) + \Omega (f_t) + constant$

l()为损失函数

$\large \Omega$ 是正则项

constant是常数项

XGboost 的核心算法思想：

1、不断添加树，每添加一个树，即学习一个新的函数f(x)，去拟合上次预测的残差

2、训练完成后得到k颗树，根据样本特征，在每棵树中都会落到一个叶子节点下

3、叶子结点对应的值相加就是预测结果

新加入的树如何构建呢？

新的f_t(x)使得目标函数尽可能的小

正则项部分

XGboost对树的复杂度包含两部分：

1、树中叶子节点的个数T

2、树上叶子节点的得分w的L2模平方即对w进行L2正则化（目的：避免过拟合）

树的复杂度越小，泛化能力越强

XGboost和GBDT的不同

1、XGboost加入了正则项控制模型复杂度

2、GBDT只用了代价函数的一阶导数信息， XGboost对代价函数二阶泰勒展开，同时使用一阶、二阶导数

3、GBDT采用CART作为基分类器，XGboost支持多类型基分类器

4、GBDT每次迭代采用全部数据，XGboost采用与随机森林相似策略，支持数据采样

XGboost为什么要用泰勒展开

常见问题

1、xgboost适合处理哪些场景的问题？

2、xgboost 和 LR 的区别（应用）

3、xgboost的底层算法

4、xgboost的特征重要性计算、正则表达式

5、xgboost的原理，如何防止过拟合

6、lightgbm xgboost rf lr 优缺点应用场景

7、如果实现特征并行化

8、xgboost如何做分类任务

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
XGboost

什么是XGboostXGboost本质上还是GBDT，两者都是Boosting方法XGboost 和 GBDT的主要区别是目标函数的定义XGboost的目标函数是l()为损失函数是正则项constant是常数项XGboost 的核心算法思想：1、不断添加树，每添加一个树，即学习一个新的函数f(x)，去拟合上次预测的残差2、训练完成后得到k颗树，根据样本特征，在每棵树中都会落到一个叶子节点下3、叶子结点对应的值相加就是预测结果新加入的树如何构建呢？新的.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。