论文解读15——LightGBM: A Highly Efficient Gradient Boosting Decision Tree

对流层的酱猪肘

于 2023-03-10 21:37:12 发布

阅读量712

点赞数

分类专栏：论文解读文章标签： boosting 决策树算法

本文链接：https://blog.csdn.net/weixin_47133012/article/details/129444180

版权

论文解读专栏收录该内容

20 篇文章 12 订阅

订阅专栏

LightGBM是一种针对XGBoost的优化，通过直方图算法减少分裂点，基于梯度的单边采样（GOSS）减少样本量，和互斥特征捆绑（EFB）减少特征，从而提高内存效率和计算速度。直方图算法通过分桶减少计算量和内存消耗，GOSS考虑梯度信息进行采样，EFB将互斥特征捆绑以减少特征数。

摘要由CSDN通过智能技术生成

1、文章贡献

提出了一个轻量级的梯度提升算法LightGBM，是GBDT算法的另一个实现，针对XGBoost的局限，在保持精确度的情况下对内存和效率上进行了优化。

LightGBM改进点：

采用直方图算法Histogram解决分裂点数过多的问题。
采用基于梯度的单边采样算法GOSS解决样本量过多的问题。
采用互斥特征捆绑算法EFB解决特征过多的问题。

总的来说：LightGBM = XGBoost + Histogram + EFB

2、直方图算法Histogram（减少分裂点）

对特征进行分桶操作，并计算每个桶中的特征数以及梯度求和，寻找最优分裂点。此时需要遍历的分裂点数等于桶数减1，相比分桶前遍历的点数少很多，减少了计算量，且占用更少的内存。

内存占用少：

直方图算法不仅不需要额外存储预排序的结果，而且可以只保存特征离散化后的值，而这个值一般用 8位整型存储就足够了，内存消耗可以降低为原来的1/8。也就是说XGBoost需要用 32位的浮点数去存储特征值，并用 32 位的整形去存储索引，而 LightGBM只需要用 8 位去存储直方图，内存相当于减少为 1/8。

计算代价小：

预排序算法XGBoost每遍历一个特征值就需要计算一次分裂的增益，而直方图算法LightGBM只需要计算 k 次，时间复杂度从O(#data * #feature)降低到O(k * #feature)

另一个优化是直方图作差加速

一个叶子的直方图可以由它的父亲节点的直方图与它兄弟的直方图做差得到，在速度上可以提升一倍。（在实际构建过程中，可以先计算直方图小的叶子节点，然后利用直方图做差来获得直方图大的叶子节点，以减少计算代价）

在叶子生长策略上

XGBoost采用 Level-wise按层生长策略，即不管这个叶子分裂后增益怎么样，每一层叶子都会分裂过去，带来很多没必要的计算开销。

LightGBM采用Leaf-wise按叶子生长的策略，每次在当前待分裂的所有叶子中找到增益最大的进行分裂，可以避免增益较低的叶子不必要的分裂，且增加了最大深度的限制，在提高效率的同时防止过拟合。