决策树的集成

本文介绍了决策树的集成方法,包括随机森林和GBDT。随机森林通过多棵决策树的投票或平均得出结果,具有处理高维数据、评估特征重要性等优点。GBDT则是通过梯度提升构建决策树,不断修正错误,提升预测效果。
摘要由CSDN通过智能技术生成

决策树的集成

集成方法

决策树模型简单明了,但是单独使用效果并不理想,通过某种方式将多个决策树组合起来,使用它们的"集体智慧"来解决问题。成为集成方法(ensemble method),可以分为两类:平均方法(averaging method)和提升方法(boosting methods),对应的模型是随机森林和GBDT。

随机森林

  • 随机森林由n个决策树组成,模型的预测结果等于各决策树结果的某种"加权平均"。
    • 分类问题
      最终结果等于在决策树预测结果中出现次数最多的类别。可以理解成"投票法",直观上,将多个决策树想象成多个人,而随机森林想象成一场投票,通过少数服从多数得到最终结果。
    • 回归问题
      最终结果等于决策树预测结果的平均值。
  • 解释一下为什么叫random forest
    • 森林:一棵树的犯错概率比较大,但是多个树犯错的概率很小。可以理解三个臭皮匠,顶个诸葛亮,这样就容易理解多了。注意,预测效果的最重要保证是各个树相互独立。
    • 随机:(1)对于每个决策树,从原始训练集随机选取该决策树的数据。
      (2)在划分节点时,并不需要遍历全部变量,而是随机选取其中的一部分作为随机变量。
      (3)在选择自变量的划分阈值时,并不求得最优的解,而是随机构成候选阈值集合,并从中选取效果最优。(子节点的不纯度之和最低)。ps 不
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值