客户流失预警模型-GBDT模型

最新推荐文章于 2024-06-29 16:56:12 发布

慢爬小蜗牛

最新推荐文章于 2024-06-29 16:56:12 发布

阅读量1.4k

点赞数 1

分类专栏：贷前风控-风控建模

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoxiaoniaoer1/article/details/103675231

版权

本文介绍了GBDT模型参数调优在金融数据建模中的应用，特别是针对客户流失预警。讨论了关键参数如n_estimators、learning_rate、Subsample，并通过网格搜索找到最佳参数组合，如最大深度、最小样本数等，以提高模型的预测性能。最终，通过调整步长和迭代次数，优化模型的泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GBDT模型参数问题，这里我们以sklearn里面的GBDT为例来说，打开网址sklearn.ensemble.GradientBoostingClassifier。这里我们不关注GBDT里面的所有参数意义，只解释下在对金融数据建模调参时最常用的一些参数意义：

GBDT框架的参数

n_estimators: 分类树的个数,即K

learning_rate: 即每个弱学习器的权重缩减系数ν,也称作步长。较小的ν意味着需要更多

的弱学习器的迭代次数。参数n_estimators和learning_rate要一起调参。可以从一个小一点的ν开始调参,默认是1

Subsample: (不放回)抽样率,推荐在[0.5, 0.8]之间,默认是1.0,即不使用子采样

init: 即初始化的时候的弱学习器,一般用在对数据有先验知识,或者之前做过一些拟合的时候

loss: 即GBDT算法中的损失函数

弱分类树的参数

max_features: 划分时考虑的最大特征数

max_depth: 决策树最大深度

min_samples_split:内部节点再划分所需最小样本数。默认是2.如果样本量不大,不需要管

这个值。如果样本量数量级非常大,则推荐增大这个值

min_samples_leaf: 叶子节点最少样本数

min_weight_fraction_leaf:叶子节点最小的样本权重。默认是0,就是不考虑权重问题。

一般来说,如果我们有较多样本有缺失值,或者分类树样本的分布类别偏差很大,就会引入样本权重,这时我们就要注意这个值了

max_leaf_nodes: 最大叶子节点数,通过限制最大叶子节点数,可以防止过拟合

min_impurity_split: 节点划分最小不纯度

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。