LightGBM的并行优化

最新推荐文章于 2022-08-28 16:46:33 发布

ictcxq

最新推荐文章于 2022-08-28 16:46:33 发布

阅读量6.4k

点赞数 6

分类专栏：深度学习文章标签：并行算法数据并行特征并行 LightGBM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ictcxq/article/details/78736442

版权

本文探讨LightGBM的并行学习算法，包括特征并行和数据并行。特征并行通过减少特征分裂点的传输，优化了效率；数据并行利用Reduce Scatter和直方图减法降低传输代价。这两种方法在处理大规模数据时能有效分担worker压力。

摘要由CSDN通过智能技术生成

上一篇文章介绍了LightGBM算法的特点，总结起来LightGBM采用Histogram算法进行特征选择以及采用Leaf-wise的决策树生长策略，使其在一批以树模型为基模型的boosting算法中脱颖而出。在时间和空间上都更胜一筹，准确率也比其他模型表现得更好。这些模型在处理一般规模的数据时，单机即可以解决，然而当数据规模更大时，即需要进行分布式计算，分担每台机器（worker）的压力。这篇文章介绍LightGBM的两种并行学习算法（Feature Parallel & Data Parallel），以及他们较传统并行算法的特别之处。

- Feature Parallel

特征并行算法目的是在决策树生成过程中的每次迭代，高效地找到最优特征分裂点。特征并行的主要思想是在不同机器在不同的特征集合上分别寻找最优的分割点，然后在机器间同步最优的分割点。

传统的特征并行算法
1. 根据不同的特征子集，将数据集进行垂直切分。（不同机器worker有不同的特征子集）
2. 每个worker寻找局部的最优分裂特征以及分裂点。
3. 不同worker之间进行网络传输，交换最优分裂信息，最终得到最优的分裂信息。
4. 具有最优分裂特征的worker，局部进行分裂，并将分裂结果广播到其他worker。
5. 其他worker根据接收到的数据进行切分数据。
该方法不能有效地加速特征选择的效率，当数据量#data很大时，该并行方法不能加快效率。并且，最优的分裂结果需要在worker之间进行传输，需要消耗很多的传输资源以及传输时间。
LightGBM的特征并行算法

最低0.47元/天解锁文章

关注

6
点赞
踩
13

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

ictcxq CSDN认证博客专家 CSDN认证企业博客

码龄8年

6: 原创

119万+: 周排名

126万+: 总排名

4万+: 访问

: 等级

455: 积分

10: 粉丝

17: 获赞

7: 评论

42: 收藏

私信

关注

热门文章

分类专栏

深度学习 6篇
机器学习 2篇

最新评论

信息检索的评价指标介绍——MAP，NDCG
windcloudha: mAP写错了。query 2有4个相关网页，计算AP的时候是除以4，不是除以3
Tree ensemble算法中feature importance计算方法
lmw0320: 同问。。我怎么有点感觉是信息增益？但如果是CART算法的话，应用的又是GINI指数，这里又不存在。。还是迷糊。。。
Tree ensemble算法中feature importance计算方法
wsplmmy: 1（vt =j) 是什么，什么叫平方损失，特征xj 在单独一个树上的特征重要度可以再解释一下吗
LightGBM的并行优化
全站最菜QAQ 回复 doyone: 并行是因为要遍历所有特征的分裂点找最优，因为单机耗时，所以才用并行，不同的机器同时找不同特征的最优分裂点。
LightGBM的并行优化
rosefunR 回复 doyone: 我猜会不会是，虽然每个worker都有全部数据集，但只对其中一部分特征集进行搜索，然后合并局部最优分裂信息。

大家在看

平安银行25届校招测评：北森销售人员认知与胜任能力测评/笔试通关攻略 179

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。