XGBoost预排序算法的疑问（求大佬解答）

最新推荐文章于 2024-02-07 10:40:31 发布

Doodlera

最新推荐文章于 2024-02-07 10:40:31 发布

阅读量1.5k

点赞数 3

分类专栏： PYTHON XGBoost 文章标签：算法决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35248792/article/details/115628953

版权

PYTHON 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

在XGBoost中，使用预排序的方法来处理节点分裂，会先对每个特征按照特征值大小进行排序，然后保存为block结构，后面的迭代中会重复地使用这个结构，使计算量大大减小。
对这一点存在一些疑问：
举例说明，假设一个样本有“年龄”，“身高”两个特征，取值分别为

[23,24,25,26,27,99],[244,180,181,175,172,168]。

预排序后分别为

[23,24,25,26,27,99],[168,172,175,180,181,244]。

假设第一次选择“年龄”为26进行分裂，分裂后节点左侧的样本为“年龄”[23,24,25]，身高[244,180,181]，节点右侧样本为“年龄”[27，99]，身高[172,168]。此时，因为切分后样本的变化，身高数据与预排序结果不同，需要重新进行排序，计算节点分裂增益。
如果上述过程没有错误的话，预排序并没有使计算量大幅度减小。不知道有没有哪位大佬可以解答我的困惑。

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
5
评论
XGBoost预排序算法的疑问（求大佬解答）

在XGBoost中，使用预排序的方法来处理节点分裂，会先对每个特征按照特征值大小进行排序，然后保存为block结构，后面的迭代中会重复地使用这个结构，使计算量大大减小。对这一点存在一些疑问：举例说明，假设一个样本有“年龄”，“身高”两个特征，取值分别为[23,24,25,26,27,99],[244,180,181,175,172,168]。预排序后分别为[23,24,25,26,27,99],[168,172,175,180,181,244]。假设第一次选择“年龄”为26进行分裂，分裂后节点左
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。