Random Forest和Gradient Boosting调参小结

本文总结了随机森林和梯度提升两种算法的调参要点。随机森林侧重降低方差,常用参数如子模型数、最大树深度;梯度提升则关注降低偏差,主要参数包括子模型数和学习率。通过调整这些参数,可以优化模型性能。
摘要由CSDN通过智能技术生成

先补充一下相关概念:

Bagging对样本重采样,对每一重采样得到的子样本集训练一个模型,最后取平均,降低模型的 variance。

Boosting 则是迭代算法,每一次迭代都根据上一次迭代的预测结果对样本进行加权,所以随着迭代不断进行,误差会越来越小, bias 会不断降低。


bagging中的模型是强模型,偏差低,方差高。目标是降低方差。在bagging中,每个模型的bias和variance近似相同,但是互相相关性不太高,因此一般不能降低Bias,而一定程度上能降低variance。典型的bagging是random forest。

boosting中每个模型是弱模型,偏差高,方差低。目标是通过平均降低偏差。boosting的基本思想就是用贪心法最小化损失函数,显然能降低偏差,但是通常模型的相关性很强,因此不能显著降低variance。典型的Boosting是adaboost,GBDT。


过拟合的模型,通常variance比较大,这时应该用bagging对其进行修正。

欠拟合的模型,通常Bias比较大,这时应该可以用boosting进行修正。


参数可分为两类:

过程影响类(如:“子模型数”(n_estimators)、“学习率”(learning_rate)等ÿ

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值