【掰开揉碎】lightgbm params 各参数含义

叫我兔兔酱

于 2024-01-14 19:06:59 发布

阅读量437

点赞数 8

分类专栏：掰开揉碎文章标签： python 机器学习开发语言

本文链接：https://blog.csdn.net/tutututu12345678/article/details/135586882

版权

掰开揉碎专栏收录该内容

19 篇文章 0 订阅

订阅专栏

LightGBM（Light Gradient Boosting Machine）是一种梯度提升框架，用于高效地训练梯度提升树模型。它具有许多参数，可以影响模型的性能和训练过程。以下是一些常用的LightGBM参数及其含义：

boosting_type: 提升类型，可以是"gbdt"（传统的梯度提升树）、"dart"（Dropouts meet Multiple Additive Regression Trees）、"goss"（Gradient-based One-Side Sampling）或"rf"（随机森林）。
num_leaves: 每棵树的叶子节点数。较大的值可以提高模型的复杂度，但也容易过拟合。
learning_rate: 学习率，控制每次迭代的步长。较小的学习率通常需要较多的迭代次数来达到收敛，但也有助于避免过拟合。
n_estimators: 总共要训练的树的数量（迭代次数）。
max_depth: 树的最大深度。可以用来限制树的复杂度，防止过拟合。
min_child_samples: 每个叶子节点所需的最小样本数。用于控制树的生长过程，防止过拟合。
subsample: 每次迭代时使用的训练样本的子采样比例。可以减少过拟合的风险。
colsample_bytree: 每次迭代时用于构建树的特征的子采样比例。
reg_alpha: L1正则化的系数。可以用来控制模型的复杂度，防止过拟合。
reg_lambda: L2正则化的系数。类似于reg_alpha，用来控制模型的复杂度。
min_split_gain: 分裂节点时的最小增益。用于控制树的生长过程，防止过拟合。
objective: 指定要最小化的损失函数，例如"regression"（回归问题）、"binary"（二分类问题）、"multiclass"（多分类问题）等。
categorical_feature: 指定哪些特征是分类特征，可以提供特征索引或列名。
early_stopping_rounds: 提前停止的迭代次数，当验证集上的损失不再减少时，训练会提前终止。
verbose: 控制训练过程中的输出信息级别。

叫我兔兔酱

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
【掰开揉碎】lightgbm params 各参数含义

提升类型，可以是"gbdt"（传统的梯度提升树）、"dart"（Dropouts meet Multiple Additive Regression Trees）、"goss"（Gradient-based One-Side Sampling）或"rf"（随机森林）。: 指定要最小化的损失函数，例如"regression"（回归问题）、"binary"（二分类问题）、"multiclass"（多分类问题）等。: 提前停止的迭代次数，当验证集上的损失不再减少时，训练会提前终止。，用来控制模型的复杂度。
复制链接

扫一扫