决策树随机森林

目录

 

决策树的过拟合

剪枝算法

Bootstraping

应用

一种可能的方案

样本不均衡的常用处理方法

使用RF建立计算样本间相似度

Isolation Forest

决策树分类鸢尾花数据

随机森林

决策树用于拟合

多输出的决策树回归


决策的过

决策树对训练属于有很好的分类能力,但对 未知的测试数据未必有好的分类能力,泛化 能力弱,即可能发生过拟合现象。

解决的方法:剪枝,随机森林。

剪枝数的

剪枝

Bootstraping

Bootstraping的名称自成pull up by your own  bootstraps意思是依你自的资,称自助 法,它是一种有放回的样方

Bagging

bootstrap aggregation

从样本集中重采样(有重复的)选出n个样本,在所有属性上,对这n个样本建立分类器(ID3C4.5CARTSVMLogistic回归等)重复以上两步m次,即获得m个分类器,将数据放在这m个分类器上,最后根据个分类器的投票结果,决定数据属于哪一类。

随机森林

随机森林在bagging基础上做了修改。从样本集中用Bootstrap采样选n样本;从所有属性中随机选择k性,择最分割 属性作为节点建CART决策;重复以上两步m次,即建立了mCART决策树,这mCART机森林通过投表决结,  决定数据属于哪一类。

应用

 

一种能的

样本均衡常用理方法

使用RF建立计算本间似度

x1,x3在同叶节点中,即相似度大,x1,x3与x2相似度不大。

 

Isolation Forest

 

决策树分类鸢尾花数据

随机森林

决策用于

多输的决树回归

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值