LightGBM

LightGBM在XGBoost的基础上进行了优化,通过使用直方图和leaf-wise生长策略提高速度和减少内存消耗。它解决了XGBoost中预排序导致的计算代价和过拟合问题,以及level-wise生长的低效率。LightGBM还支持类别特征,并使用直方图做差加速,提供了一种有效处理高维类别特征的方法。
摘要由CSDN通过智能技术生成

和XBGoost一样使用了二阶导数,LightGBM速度快,内存小,精度和XGBoost相当。

首先,列出LightGBM主要针对XGBoost哪两个方面进行了改进:
1)XGBoost使用了预排序,这样的好处是可以精确的找到split point,但是计算代价很大,内存很大,也可能造成过拟合
2)XGBoost使用Level-wise tree growth,便于并行,但是有些节点没必要进行分裂

LightGBM特点:

  1. 使用直方图简化计算
    将连续特征离散化为k个整数,在遍历数据的时候,根据离散化后的值作为索引在直方图中累计统计量。根据直方图的离散值,寻找最优分割点。
  2. 使用leaf-wise代替level-wise
    level-wise是同时分裂同一层的叶子节点,但是这样是很低效的,因为有些叶子的分裂增益较低,没有必要进行分裂。
    leaf-wise是每次从当前所有叶子中,找到分裂增益最大的叶子,将其进行分裂。leaf-wise的缺点是可能会长出比较深的树,从而过拟合。因此增加了max-depth的限制。
  3. 支持类别特征
  4. 直方图做差加速

下面我们对类别特征多一点了解:
one-hot编码是无序类别特征的一种解决方法,但是在树模型里,并不合适,特别是特征维度特别高的时候,因为会面临下面两个问题:
问题一: 当特征维度很高的时候,one-vs-rest会造成one的那一边数据很少,可能无法在这个类别特征上进行切分。(直观来讲,不平衡的切分和不切分几乎没有区别)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值