scikit-learn 梯度提升树(GBDT)调参小结

最新推荐文章于 2023-12-24 17:32:38 发布

VIP文章 lHz76ttw1U

最新推荐文章于 2023-12-24 17:32:38 发布

阅读量787

点赞数

本文链接：https://blog.csdn.net/lhz76ttw1u/article/details/60876247

版权

　　在梯度提升树(GBDT)原理小结中，我们对GBDT的原理做了总结，本文我们就从scikit-learn里GBDT的类库使用方法作一个总结，主要会关注调参中的一些要点。

1. scikit-learn GBDT类库概述

　　　　在sacikit-learn中，GradientBoostingClassifier为GBDT的分类类，而GradientBoostingRegressor为GBDT的回归类。两者的参数类型完全相同，当然有些参数比如损失函数loss的可选择项并不相同。这些参数中，类似于Adaboost，我们把重要参数分为两类，第一类是Boosting框架的重要参数，第二类是弱学习器即CART回归树的重要参数。

　　　　下面我们就从这两个方面来介绍这些参数的使用。

2. GBDT类库boosting框架参数

　　　　首先，我们来看boosting框架相关的重要参数。由于GradientBoostingClassifier和GradientBoostingRegressor的参数绝大部分相同，我们下面会一起来讲，不同点会单独指出。

　　　　1) n_estimators: 也就是弱学习器的最大迭代次数，或者说最大的弱学习器的个数。一般来说n_estimators太小，容易欠拟合，n_estimators太大，又容易过拟合，一般选择一个适中的数值。默认是100。在实际调参的过程中，我们常常将n_estimators和下面介绍的参数learning_rate一起考虑。

　　　　2) learning_rate: 即每个弱学习器的权重缩减系数 ν ，也称作步长，在原理篇的正则化章节我们也讲到了，加上了正则化项，我们的强学习器的迭代公式为 fk(x)=fk−1(x)+νhk(x) 。 ν 的取值范围为 0<ν≤1 。对于同样的训练集拟合效果，较小的

最低0.47元/天解锁文章

lHz76ttw1U

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn 梯度提升树(GBDT)调参小结

在梯度提升树(GBDT)原理小结中，我们对GBDT的原理做了总结，本文我们就从scikit-learn里GBDT的类库使用方法作一个总结，主要会关注调参中的一些要点。1. scikit-learn GBDT类库概述　　　　在sacikit-learn中，GradientBoostingClassifier为GBDT的分类类，而GradientBoostingRegressor为G
复制链接

扫一扫