决策树、随机森林、GBDT和xgboost 简要说明与对比

1、决策树

1)ID基于信息增益为准则来选择最优划分属性

缺点:ID3决策树会倾向于那些取值较多的属性来分割树,所以会有一定的偏好。

2)C4.5:以信息增益率为准则来选择最优的划分属性

C4.5决策树倾向于首先从所有的候选划分属性中找出信息增益高于平均水平的属性,再从中选择使增益率最高的属性来分割树。

3、CART(Classification and Regression tree)分类回归树

:以基尼系数为准则选择最优分割属性,可同时使用分类和回归

 

2、随机森林:

1)随机森林是一个典型的多个决策树的组合分类器。

 

3、GBDT(Gradient Boosting Decision Tree,梯度提升树)和xgboost(extremeGradientBoosting)

1)GBDT是以决策树(CART)为基学习器的GB算法,是迭代树,而不是分类树。

2)Xgboost相比于GBDT来说,更加有效应用了数值优化,最重要是对损失函数(预测值和真实值的误差)变得更复杂。目标函数依然是所有树的预测值相加等于预测值。损失函数引入了一阶导数,二阶导数。

除此之外,xgboost工具支持并行

 

参考: <https://www.zhihu.com/question/41354392>

 

 <https://zhuanlan.zhihu.com/p/34534004>

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

samoyan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值