决策树、随机森林、GBDT和xgboost 简要说明与对比

最新推荐文章于 2024-06-06 14:45:00 发布

samoyan

最新推荐文章于 2024-06-06 14:45:00 发布

阅读量1.5k

点赞数

文章标签：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baoyan2015/article/details/107184231

版权

1、决策树

1）ID基于信息增益为准则来选择最优划分属性

缺点：ID3决策树会倾向于那些取值较多的属性来分割树，所以会有一定的偏好。

2）C4.5：以信息增益率为准则来选择最优的划分属性

C4.5决策树倾向于首先从所有的候选划分属性中找出信息增益高于平均水平的属性，再从中选择使增益率最高的属性来分割树。

3、CART(Classification and Regression tree)分类回归树

：以基尼系数为准则选择最优分割属性，可同时使用分类和回归

2、随机森林：

1）随机森林是一个典型的多个决策树的组合分类器。

3、GBDT(Gradient Boosting Decision Tree，梯度提升树)和xgboost(extremeGradientBoosting)

1）GBDT是以决策树（CART）为基学习器的GB算法，是迭代树，而不是分类树。

2）Xgboost相比于GBDT来说，更加有效应用了数值优化，最重要是对损失函数（预测值和真实值的误差）变得更复杂。目标函数依然是所有树的预测值相加等于预测值。损失函数引入了一阶导数，二阶导数。

除此之外，xgboost工具支持并行

参考： <https://www.zhihu.com/question/41354392>

<https://zhuanlan.zhihu.com/p/34534004>

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
决策树、随机森林、GBDT和xgboost 简要说明与对比

1、决策树1）ID基于信息增益为准则来选择最优划分属性缺点：ID3决策树会倾向于那些取值较多的属性来分割树，所以会有一定的偏好。2）C4.5：以信息增益率为准则来选择最优的划分属性C4.5决策树倾向于首先从所有的候选划分属性中找出信息增益高于平均水平的属性，再从中选择使增益率最高的属性来分割树。3、CART(Classification and Regression tree)分类回归树：以基尼系数为准则选择最优分割属性，可同时使用分类和回归2、随机森林：1）随机森林是.
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

samoyan 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。