RF GBDT LR调参

本文详细介绍了随机森林(RF)、梯度提升决策树(GBDT)的参数调优,包括决策树数量、特征选择、最大深度、最大叶子节点等,并提到了如何设置这些参数以避免过拟合。对于RF,决策树数量通常在10-100之间,而特征数量可选开根号或log2。在资源有限的情况下,可以使用预设的参数。GBDT与RF相似,但多了一个学习率参数。此外,还简要介绍了逻辑回归(LR)的相关参数。
摘要由CSDN通过智能技术生成

https://zhuanlan.zhihu.com/p/56940098

 

调参对于随机森林来讲,不会发生很大的波动,即使采用默认值,也可以保持不错的效果。

 

对于随机森林,比较重要的参数有2个:决策树数量;每个决策树最多使用多少特征。

对于决策树数量参数:

决策树数量越多,效果越好越稳定。但是要在合理范围内,当决策树数量增大到一定数量后,效果基本保持不变。但是随着决策树数量的增大,对硬件的性能要求越高。决策树的数量一般在10-100,可以观察随着决策树数量的增加,误差下降不是很明显了,差不多就是这个参数了。

 

对于特征数量:

每个决策树用到的特征越多,效果肯定越好,但是对于整个随机森林模型来说,希望各个决策树之间保持一定的差异性。并且单个决策树的特征越多,消耗的性能越大。

常用选项:开根号;log2;百分之20࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值