【机器学习】随机森林（Random Forest）、GBDT（Gradient Boosting Decision Tree）、XGBoost（eXtreme Gradient Boosting）

最新推荐文章于 2024-10-05 20:24:47 发布

小丫么小阿豪

最新推荐文章于 2024-10-05 20:24:47 发布

阅读量258

点赞数

文章标签：机器学习随机森林 boosting

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43426078/article/details/128022177

版权

随机森林步骤

bootstrapped dataset: 创建一个引导数据集
根据引导数据集创建决策树，每一步用变量的一个随机子集（列的随机子集）创建
不断重复上述两个过程
bagging： bootstrapping + aggregate

GBDT

好处：决策树算法相比于其他的算法需要更少的特征工程，比如可以不用做特征标准化，可以很好的处理字段缺失的数据，也可以不用关心特征间是否相互依赖等。决策树能够自动组合多个特征。不过，单独使用决策树算法时，有容易过拟合缺点。所幸的是，通过各种方法，抑制决策树的复杂性，降低单颗决策树的拟合能力，再通过梯度提升的方法集成多个决策树，最终能够很好的解决过拟合的问题。由此可见，梯度提升方法和决策树学习算法可以互相取长补短，是一对完美的搭档。

步骤

计算目标值得均值，而后计算出每个数据对均值的残差
构造树来对残差做预测，average weight + scale * (Tree’s prediction 1) + scale * (Tree’s prediction 2) … ，树的叶节点一般是4-32
预测值和真实值的区别作为新的残差，重复第二步
新的残差只要比原来的残差要小，说明训练方向是正确的

损失函数

$\frac{1}{2} \times(observed - prediction)^2$

XGBoost

参考

小丫么小阿豪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小丫么小阿豪 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。