LightGBM--调参笔记

最新推荐文章于 2023-06-24 17:58:48 发布

Huranqingqing

最新推荐文章于 2023-06-24 17:58:48 发布

阅读量493

点赞数 1

分类专栏：机器学习文章标签：机器学习算法深度学习

本文链接：https://blog.csdn.net/weixin_42727538/article/details/125305410

版权

这篇博客分享了使用LightGBM调参的经验，包括查看官方文档理解重要参数，如num_leaves、min_data_in_leaf、max_depth等，并提供了如何平衡准确率和过拟合的建议，如使用早停策略、正则化和特征子抽样。

摘要由CSDN通过智能技术生成

记录使用LightGBM时调参技巧

查看官方文档确定需要调的参数

LightGBM

LightGBM 使用 leaf-wise 的树生长策略, 而很多其他流行的算法（如xgboost）采用 depth-wise 的树生长策略. 与 depth-wise 的树生长策略相较, leaf-wise 算法可以收敛的更快. 但是, 如果参数选择不当的话, leaf-wise 算法有可能导致过拟合.

重要超参

num_leaves
这是控制树模型复杂度的主要参数. 理论上, 借鉴 depth-wise 树, 我们可以设置 num_leaves = 2^(max_depth) 但是, 这种简单的转化在实际应用中表现不佳. 这是因为, 当叶子数目相同时, leaf-wise 树要比 depth-wise 树深得多, 这就有可能导致过拟合. 因此, 当我们试着调整 num_leaves 的取值时, 应该让其小于 2^(max_depth). 举个例子, 当 max_depth=6 时(这里译者认为例子中, 树的最大深度应为7), depth-wise 树可以达到较高的准确率.但是如果设置 num_leaves 为 127 时, 有可能会导致过拟合, 而将其设置为 70 或 80 时可能会得到比 depth-wise 树更高的准确率.
min_data_in_leaf
这是处理 leaf-wise 树的过拟合问题中一个非常重要的参数. 它的值取决于训练数据的样本个树和 num_leaves. 将其设置的较大可以避免生成一个过深的树, 但有可能导致欠拟合. 实际应用中, 对于大数据集, 设置其为几百或几千就足够了.
max_depth
显式地限制树的深度，为-1时表示没有限制
bagging_fraction
默认为1.0，在不进行重采样的情况下随机选择部分数据&