LightGBM介绍

1、LightGBM简介LightGBM是一个梯度Boosting框架,使用基于决策树的学习算法。具有以下优势:a)更快的训练效率b)低内存使用c)更高的正确率d)支持并行化学习e)可以处理大规模数据2、XGBoost的不足a)每轮迭代时,都需要遍历整个训练数据多次,如果把整个训练数据装进内存,则会限制训练数据的大小,如果不装进内存,反复读写训练数据又会消耗非常大的时间。b)预排序方法的时间和空间的消耗都很大.3、LightGBM原理1)直方图算法:把连续的浮点特
摘要由CSDN通过智能技术生成

1、LightGBM简介

LightGBM是一个梯度Boosting框架,使用基于决策树的学习算法。具有以下优势:

a)更快的训练效率

b)低内存使用

c)更高的正确率

d)支持并行化学习

e)可以处理大规模数据

2、XGBoost的不足

a)每轮迭代时,都需要遍历整个训练数据多次,如果把整个训练数据装进内存,则会限制训练数据的大小,如果不装进内存,反复读写训练数据又会消耗非常大的时间。

b)预排序方法的时间和空间的消耗都很大.

3、LightGBM原理

1)直方图算法:把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图。当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍历寻找最优的分割点。在XGBoost中需要遍历所有离散化的值,而在这里只要通过遍历k个直方图的值

2)LightGBM的直方图做差加速:一个叶子的直方图可以由它的父亲节点的直方图与它兄弟的直方图做差得到,且直方图做差仅遍历直方图的k个桶

3)带深度限制的leaf-wise的叶子生长策略

4)直接支持类别特征(即不需要组偶one-hot编码)

5)支持高效并行:

a)特征并行:在不同机器在不同的特征集合上分别寻找最优的分割点,然后在机器间同步最优分割点

b)数据并行:让不同的机器先在本地构造直方图,然后进行全局的合并,最后在合并的直方图上面寻找最优分割点

4、LightG

  • 6
    点赞
  • 79
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值