XGBoost细谈

最新推荐文章于 2024-03-15 12:58:17 发布

智元说车

最新推荐文章于 2024-03-15 12:58:17 发布

阅读量3k

点赞数 2

分类专栏：机器学习文章标签：提升机器学习算法函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012771351/article/details/52997120

版权

机器学习专栏收录该内容

35 篇文章 4 订阅

订阅专栏

注：本文中所有公式和思路来自于邹博先生的《机器学习升级版》，我只是为了加深记忆和理解写的本文。

XGBoost是陈天奇先生提出的一种提升方法，较GBDT不同的是，XGBoost采用了二阶导的信息，不说废话，直接介绍推导过程。我们以CART树为例：

首先我们设定目标函数为：

这其中yi为第i个样本标记值，y~（t-1）为第t-1棵树的预测值，ft(xi)是第t棵树，Ω是为了防止过拟合加入的正则项，C我们先不理会它，后边再解释它的由来。

推导这个过程我们先要回顾一个公式：Taylor展式：

我们可以将y~（t-1）看做x， ft(xi)看做Δx，令：

可得：

现在目标函数已经得到，现在来重新说一下决策树的结构：我们使用决策树做分类或者回归，无非是从根节点到叶子节点的细化过程，落在同一个叶节点的预测值也是一样的，假设某个决策树有T个叶节点，每个叶节点的权值为W=(w1,w2...wT)，决策树的学习过程就是构造如何使用特征得到划分，从而得到这些权值的过程。如下图所示：

这里边的q(x)就是如果输入x值最终落到第几个叶节点上而已。w就是叶节点的预测值。目标函数J中的Ω的成分分析如下图：

需要解释的：正则项也就是对决策树的惩罚主要包含两部分，1.如果叶节点越多也就是T越大，越惩罚，2.叶权值平方和越大，越惩罚。

目前准备工作完成，开始计算目标函数：

此时，定义：

从而：

对wj求偏导：

最后将w带回目标函数J中：

其中G、H都是我们实现可以计算出来的：

虽然说目标函数确定了，但是这棵树是我们假设的，所以我们需要先确定这棵树的结构，可以使用ID3/C4.5/CART等方式，用贪心法实现：

1.对于某个划分点，计算划分后的J

2.对于所有的划分，选择J降低最小的分割点

枚举所有划分点，选择最大的增益，直到达到阀值或者得到纯节点：

至此，XGBoost就介绍完毕了，相对于GBDT，XGBoost采用二阶导信息，更快收敛，由于属于“随机森林族”，所以有天然好的泛华能力。

致谢：邹博先生

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
XGBoost细谈

注：本文中所有公式和思路来自于邹博先生的《机器学习升级版》，我只是为了加深记忆和理解写的本文。XGBoost是陈天奇先生提出的一种提升方法，较GBDT不同的是，XGBoost采用了二阶导的信息，不说废话，直接介绍推导过程。我们以CART树为例：首先我们设定目标函数为：这其中yi为第i个样本标记值，y~（t-1）为第t-1棵树的预测
复制链接

扫一扫

专栏目录

智元说车 CSDN认证博客专家 CSDN认证企业博客

码龄11年

34: 原创

24万+: 周排名

156万+: 总排名

12万+: 访问

: 等级

1647: 积分

64: 粉丝

67: 获赞

7: 评论

118: 收藏

私信

关注

热门文章

分类专栏

机器学习 35篇
linux 2篇
deep learning 1篇

最新评论

HMM之前向后向算法
weixin_46083434: 你好，非常感谢你的讲解让我可以把前向算法和后向算法结合起来理解，不过还有两个问题不是很明白，1. 单个状态的概率那个公式，分母P(o|lamda) 换成alphat(i)*betat(i)再对所有i（状态）求和，是因为生成观测序列o的总概率是t时刻下每个i（状态）可能的概率之和吗？ 2. 最后那个联合概率转换到最终结果不太明白，请问可以请教一下再具体一点的步骤吗？谢谢
LDA-隐狄利克雷分布-主题模型
leilei9406: 想请问下如果做短文拼接可以有哪些方法，我正在做一个短文本的LDA结果不是很好，可以请教下您吗？
变分算法
qq_36711371: 请问一下，P（x）和q（x）的距离公式中，α=1的时候，公式为什么会退化为KL(p||q)，α=1时，分母为0.
HMM之前向后向算法
Chester_ieee: 前后向概率的公式，i和t好像是写反了。
聚类之层次聚类与密度聚类
落入凡间的奥特曼: 你好，请问这个机器学习升级版是课程吗?

大家在看

数据库常见问题(持续更新) 314

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。