LightGBM

最新推荐文章于 2024-05-16 22:04:25 发布

Doooer

最新推荐文章于 2024-05-16 22:04:25 发布

阅读量409

点赞数

分类专栏：机器学习算法总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YQMind/article/details/85259889

版权

LightGBM在XGBoost的基础上进行了优化，通过使用直方图和leaf-wise生长策略提高速度和减少内存消耗。它解决了XGBoost中预排序导致的计算代价和过拟合问题，以及level-wise生长的低效率。LightGBM还支持类别特征，并使用直方图做差加速，提供了一种有效处理高维类别特征的方法。

摘要由CSDN通过智能技术生成

和XBGoost一样使用了二阶导数，LightGBM速度快，内存小，精度和XGBoost相当。

首先，列出LightGBM主要针对XGBoost哪两个方面进行了改进：
1）XGBoost使用了预排序，这样的好处是可以精确的找到split point，但是计算代价很大，内存很大，也可能造成过拟合
2）XGBoost使用Level-wise tree growth，便于并行，但是有些节点没必要进行分裂

LightGBM特点：

使用直方图简化计算
将连续特征离散化为k个整数，在遍历数据的时候，根据离散化后的值作为索引在直方图中累计统计量。根据直方图的离散值，寻找最优分割点。
使用leaf-wise代替level-wise
level-wise是同时分裂同一层的叶子节点，但是这样是很低效的，因为有些叶子的分裂增益较低，没有必要进行分裂。
leaf-wise是每次从当前所有叶子中，找到分裂增益最大的叶子，将其进行分裂。leaf-wise的缺点是可能会长出比较深的树，从而过拟合。因此增加了max-depth的限制。
支持类别特征
直方图做差加速

下面我们对类别特征多一点了解：
one-hot编码是无序类别特征的一种解决方法，但是在树模型里，并不合适，特别是特征维度特别高的时候，因为会面临下面两个问题：
问题一：当特征维度很高的时候，one-vs-rest会造成one的那一边数据很少，可能无法在这个类别特征上进行切分。（直观来讲，不平衡的切分和不切分几乎没有区别）。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。