lightgbm加载大规模数据

最新推荐文章于 2024-10-17 12:27:54 发布

Oa391

最新推荐文章于 2024-10-17 12:27:54 发布

阅读量421

点赞数 2

文章标签：深度学习 tensorflow python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_39157459/article/details/141297953

版权

在将数据加载到 LightGBM 的 Dataset 中时，减少内存占用，提升效率的优化建议：

1. 分块处理数据

import lightgbm as lgb

# 假设你已经有一部分数据处理完毕并存放在内存或 memmap 中
train_data = lgb.Dataset(data=None, label=None, free_raw_data=False)

batch_size = 100000  # 根据系统内存大小调整

for start_idx in range(0, total_samples, batch_size):
    end_idx = min(start_idx + batch_size, total_samples)
    data_block = load_data_block(start_idx, end_idx)  # 自定义函数来加载数据块
    label_block = load_label_block(start_idx, end_idx)  # 自定义函数来加载标签块
    
    # 将每个数据块添加到

最低0.47元/天解锁文章

博客等级

码龄8年

16
原创

64
点赞

104
收藏

129
粉丝

关注

私信

热门文章

最新评论

LightGBM GPU 加速训练和推理的方法
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
[一种解决方法]Anaconda3安装后缺失大量文件
sad_dots: 删除文件两个文件：C:\Users\用户名\ .condarc与C:\Users\用户名\ .conda，重新安装，终于没问题了！！ condarc中是一些以前配置的清华源路径，conda是以前的一些环境变量。
[一种解决方法]Anaconda3安装后缺失大量文件
chenhuiqichen: 这个问题解决了吗，遇到同样的问题
[一种解决方法]Anaconda3安装后缺失大量文件
LWBnb123: 你解决了吗大佬我也是这样的开始是全的到安装快结束突然就没了电脑重装系统全还很正常。。。
[一种解决方法]Anaconda3安装后缺失大量文件
爱学习的老顽童: 现在如何了，我的也是如此，老版本，新版本，杀毒软件关闭，各种方法，还是缺失文件，开始都安装，后面自动删除，什么情况，以前安装过根本没有问题。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。