学习日记（二）

最新推荐文章于 2024-07-25 22:24:14 发布

azzzz____

最新推荐文章于 2024-07-25 22:24:14 发布

阅读量475

点赞数 4

文章标签：学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/azzzz____/article/details/131970228

版权

摘抄整理大多来自：lightgbm调参的关键参数_lightgbm maxbin_yessica_Chen的博客-CSDN博客

和lightgbm使用手册——参数篇_模型lgb_爱挠静香的下巴的博客-CSDN博客

LightGBM优点：

基于Histogram的决策树算法
带深度限制的Leaf-wise的叶子生长策略
直方图做差加速
直接支持类别特征
Cache命中率优化
基于直方图的稀疏特征优化
多线程优化

LGB是一种高效、分布式的梯度提升树算法，具有训练速度快、内存占用少等优点。在使用LGB时，可以设置一些参数来优化模型的性能。

LGB常见参数调整：

提高准确率

（1）learn_rate 学习率

默认值：0.1
最开始可以设置得大一些，如0.1。调整完其他参数之后最后再将此参数调小。
建议取值范围:0.01~0.3 0.001~1 ?

（2）max_depth 树的深度（叶结点最大深度）

默认值：-1
需要考虑到数据量、特征维度和连续特征的数量。大多数情况下，建议设置<=20。在数据量较小的情况下、连续特征的数量较多时，可以设置较低的max_depth，以避免过拟合。
建议取值范围：3-8（不超过10）

（3）num_leaves 叶子节点数

默认值：31

值越大，模型的复杂度越高，容易出现过拟合。值越小，模型的复杂度越低，容易出现欠拟合。

降低过拟合

（1）max_bin 工具箱数

工具箱的最大数特征值决定了容量。最小数特征值可能会降低训练的准确性, 但是可能会增加一些一般的影响（处理过度学习）
LightGBM 将根据 max_bin 自动压缩内存。例如, 如果 maxbin=255, 那么 LightGBM 将使用 uint8t 的特性值

（2）min_data_in_leaf 一个叶子上数据的最小数量。可以用来处理过拟合

默认值：20

尽量不要太大。

（3）feature_fraction 每次迭代中随机选择特征的比例。控制在每一次树木生长时选择多少特征

默认值：1.0

常用的取值范围是0.5到1。

可用来加速训练、处理过拟合。

（4）bagging_fraction 每次迭代中，模型将使用多少数据

默认值：1.0

常见的取值范围:0.5~1。值越小，模型的多样性更强，越不容易过度拟合。

（5）bagging_freq 每n次迭代进行子采样

默认值：0
调参策略：3-5。减少子采样的频率可以提高准确性，但会增加训练时间。

（6）lambda_l1/l2 正则

（7）min_split_gain 执行切分的最小增益
默认值：0.1

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
学习日记（二）

在数据量较小的情况下、连续特征的数量较多时，可以设置较低的max_depth，以避免过拟合。LGB是一种高效、分布式的梯度提升树算法，具有训练速度快、内存占用少等优点。在使用LGB时，可以设置一些参数来优化模型的性能。最小数特征值可能会降低训练的准确性, 但是可能会增加一些一般的影响（处理过度学习）值越大，模型的复杂度越高，容易出现过拟合。值越小，模型的复杂度越低，容易出现欠拟合。常见的取值范围:0.5~1。值越小，模型的多样性更强，越不容易过度拟合。减少子采样的频率可以提高准确性，但会增加训练时间。
复制链接

扫一扫

azzzz____ CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

156万+: 周排名

24万+: 总排名

2702: 访问

: 等级

57: 积分

49: 粉丝

27: 获赞

2: 评论

26: 收藏

私信

关注

热门文章

分类专栏

idea 1篇

最新评论

idea构建ssm时遇到的问题（不全）
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
学习日记（二）
CSDN-Ada助手: 非常感谢你的第二篇博客！你的学习日记对于我们这些正在学习的人来说是非常有帮助的。我鼓励你继续创作，分享更多有关数据分析和机器学习的知识。除了你在标题和摘要中提到的内容，还有一些与该博文相关的扩展知识和技能。比如，你可以进一步学习和掌握其他的梯度提升树算法，例如XGBoost和CatBoost。此外，了解交叉验证和调参技巧也是非常有用的，可以帮助你进一步优化模型的性能。再次感谢你的分享，期待看到更多精彩的博客！请继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。