RandomForestClassifier参数min_samples_leaf和min_samples_split理解

本文介绍了决策树算法中的min_samples_split和min_samples_leaf参数,它们分别用于设定节点分裂和叶节点最小样本数,防止过拟合并促进模型稳定。特别强调了在回归树中使用这两个参数的重要性,以及如何合理设置以优化模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

而min_samples_split限定,⼀个结点必须要包含⾄少min_samples_split个训练样本,这个结点才允许

被分⽀,否则分⽀就不会发⽣。

min_samples_leaf限定,⼀个结点在分⽀后的每个⼦结点都必须包含⾄少min_samples_leaf个训练样

本,否则分⽀就不会发⽣,或者,分⽀会朝着满⾜每个⼦结点都包含min_samples_leaf个样本的⽅向去

发⽣。⼀般搭配max_depth使⽤,在回归树中有神奇的效果,可以让模型变得更加平滑。这个参数的数量设置

得太⼩会引起过拟合,设置得太⼤就会阻⽌模型学习数据。⼀般来说,建议从=5开始使⽤。如果叶结点

中含有的样本量变化很 ⼤,建议输⼊浮点数作为样本量的百分⽐来使⽤。同时,这个参数可以保证每个

叶⼦的最⼩尺⼨,可以在回归问题中避免低⽅差,过拟合的叶⼦结点出现。对于类别不多的分类问题,

=1通常就是最佳选择。

而min_samples_split限定,⼀个结点必须要包含⾄少min_samples_split个训练样本,这个结点才允许

被分⽀,否则分⽀就不会发⽣。

https://www.cda.cn/discuss/post/details/5ed0b97b845aee319064b59b

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值