为什么xgboost/gbdt在调参时为什么树的深度很少就能达到很高的精度？

programmingfool5

于 2018-09-04 12:34:28 发布

阅读量594

点赞数

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/programmingfool5/article/details/82381657

版权

算法同时被 2 个专栏收录

13 篇文章

订阅专栏

9 篇文章

订阅专栏

本文通过统计学视角解析集成学习中的两种关键方法——Bagging与Boosting。Bagging旨在减少方差，适用于决策树及神经网络等模型；Boosting则聚焦于降低偏差，擅长构建基于弱学习器的强大集成模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

链接：https://www.zhihu.com/question/45487317/answer/99153174 来源：知乎

这个问题很好，回答的也很好。让我重新以统计学来认知两个重点的集成学习方法：
一句话的解释，来自周志华老师的机器学习教科书（机器学习-周志华）：

Boosting主要关注降低偏差，因此Boosting能基于泛化性能相当弱的学习器构建出很强的集成，比如GBDT在后续的子树的学习过程会修正前面的误差；
Bagging主要关注降低方差，因此它在不剪枝的决策树、神经网络等学习器上效用更为明显。
随机森林(random forest)和GBDT都是属于集成学习（ensemble learning)的范畴。集成学习下有两个重要的策略Bagging和Boosting。
Boosting的意思是这样，他通过迭代地训练一系列的分类器，每个分类器采用的样本分布都和上一轮的学习结果有关。其代表算法是AdaBoost, GBDT。
其实就机器学习算法来说，其泛化误差可以分解为两部分，偏差（bias)和方差(variance)。这个可由下图的式子导出（这里用到了概率论公式D(X)=E(X^2)-[E(X)]^2）。偏差指的是算法的期望预测与真实预测之间的偏差程度，反应了模型本身的拟合能力；方差度量了同等大小的训练集的变动导致学习性能的变化，刻画了数据扰动所导致的影响。这个有点儿绕，不过你一定知道过拟合。高方差的模型会趋向于过拟合，记住了太多的噪音。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。