梯度提升机（Gradient Boosting Machine）之 LightGBM

最新推荐文章于 2024-05-26 21:03:13 发布

Eip3C

最新推荐文章于 2024-05-26 21:03:13 发布

阅读量680

点赞数

分类专栏：机器学习文章标签：算法决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46430424/article/details/109600317

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

随着大数据时代的到来，GBDT正面临着新的挑战，特别是在精度和效率之间的权衡方面。传统的GBDT实现需要对每个特征扫描所有数据实例，以估计所有可能的分割点的信息增益。因此，它们的计算复杂度将与特征数和实例数成正比。这使得这些实现在处理大数据时非常耗时。所以微软亚洲研究院提出了 LightGBM ，其设计理念是：

单个机器在不牺牲速度的情况下，尽可能使用上更多的数据
多机并行的时候,通信的代价尽可能地低,并且在计算上可以做到线性加速。

LightGBM 与 XGBoost 相似，也是一种梯度提升机，但是与XGBoost不同的是，其选择按叶生长（每一层只对一个节点进行分支），并且使用直方图算法避免了每次寻找分割点时的排序操作，只需要在一开始对全部数据进行排序后找到分割点，每次寻找分割点时只需要简单地分桶操作。同时其寻找最佳分割点的依据仍然是 XGBoost 中所提到的，根据一阶导数和二阶导数求出最佳的解和目标值，根据贪心算法穷举所有分组，从而找出最佳分组，同时为了提高效率提出了两个方法：

单边采样：对于需要训练的样本给予重视，而不需要训练的数据进行随机采样，同时为了保证减小对损失函数的影响对于随机采集的数据予以权重。
互斥特征融合：根据度（连接数，即与其他特征发生冲突的可能性）对其降序排序，使用贪心前向搜索算法，将冲突率小于要求值的特征进行绑定。然后使用直方图进行横向融合。

决策树学习算法（Decision Tree Learning Algorithm)

传统的决策树的生成方法有：按叶生长（Leaf-wise tree growth）和按层生长（Level-wise tree growth）两种。

其中按层生长是将每一个节点都分割为两个叶子节点。其虽然有天然的并行性，但是会有很多不必要的分裂产生，造成更多的计算代价。

dfddfdfdf

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
梯度提升机（Gradient Boosting Machine）之 LightGBM

随着大数据时代的到来，GBDT正面临着新的挑战，特别是在精度和效率之间的权衡方面。传统的GBDT实现需要对每个特征扫描所有数据实例，以估计所有可能的分割点的信息增益。因此，它们的计算复杂度将与特征数和实例数成正比。这使得这些实现在处理大数据时非常耗时。所以微软亚洲研究院提出了 LightGBM ，其设计理念是：单个机器在不牺牲速度的情况下，尽可能使用上更多的数据多机并行的时候,通信的代价尽可能地低,并且在计算上可以做到线性加速。LightGBM 与 XGBoost 相似，也是一种梯度提升机，但是与
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。