LightGBM算法解析

最新推荐文章于 2024-06-01 12:22:13 发布

Tom Hardy

最新推荐文章于 2024-06-01 12:22:13 发布

阅读量850

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_29462849/article/details/91345350

版权

LightGBM是微软在2017年开源的升压工具，相较于XGBoost，它在速度上快了约10倍，内存占用减少了3倍。其主要优点包括：直方图算法降低内存和计算成本；Leaf-wise的叶子生长策略提高精度；直接支持类别特征，无需one-hot编码；并行学习优化。通过这些特性，LightGBM在保持高精度的同时实现了高效训练。

摘要由CSDN通过智能技术生成

前言

在竞赛题中，我们知道XGBoost算法非常热门，它是一种优秀的拉动框架，但是在使用过程中，其训练耗时很长，内存占用比较大。在2017年年1月微软在GitHub的上开源了一个新的升压工具–LightGBM。在不降低准确率的前提下，速度提升了10倍左右，占用内存下降了3倍左右。因为他是基于决策树算法的，它采用最优的叶明智策略分裂叶子节点，然而其它的提升算法分裂树一般采用的是深度方向或者水平明智而不是叶，明智的。因此，在LightGBM算法中，当增长到相同的叶子节点，叶明智算法比水平-wise算法减少更多的损失。因此导致更高的精度，而其他的任何已存在的提升算法都不能够达。与此同时，它的速度也让人感到震惊，这就是该算法名字 light 的原因。

LightGBM和XGBoost算法的区别

下面这个表格给出了XGBoost和LightGBM之间更加细致的性能对比，包括了树的生长方式，LightGBM是直接去选择获得最大收益的结点来展开，而XGBoost是通过按层增长的方式来做，这样呢LightGBM能够在更小的计算代价上建立我们需要的决策树。当然在这样的算法中我们也需要控制树的深度和每个叶子结点的最小数据量，从而减少过拟合。
在这里插入图片描述

计算速度

计算速度的对比，完成相同的训练量XGBoost通常耗费的时间是LightGBM的数倍之上，在higgs数据集上，它们的差距更是达到了15倍以上。

最低0.47元/天解锁文章

Tom Hardy

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
LightGBM算法解析

前言在竞赛题中，我们知道XGBoost算法非常热门，它是一种优秀的拉动框架，但是在使用过程中，其训练耗时很长，内存占用比较大。在2017年年1月微软在GitHub的上开源了一个新的升压工具–LightGBM。在不降低准确率的前提下，速度提升了10倍左右，占用内存下降了3倍左右。因为他是基于决策树算法的，它采用最优的叶明智策略分裂叶子节点，然而其它的提升算法分裂树一般采用的是深度方向或者水平明智而...
复制链接

扫一扫

专栏目录