五、决策树与随机森林实战

一、决策树的评价
在这里插入图片描述
二、决策树的过拟合
在这里插入图片描述
决策树过拟合主要有两种处理方法:1.剪枝,2.随机森林。

剪枝分为预剪枝和后剪枝。

预剪枝是指在建立决策树的过程中进行剪枝,如给定树的最大高度、每个叶结点包含的样本最少个数、最小熵值等。

后剪枝见ppt
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
三、bagging策略
在这里插入图片描述
bagging策略常结合决策树等弱分类器,常常不与SVM、logistic回归等强分类器结合(也不是不可)。

在这里插入图片描述
通过概率论的知识推导,可得BoostStrap每次约有36.79%的样本不会出现在所采样的样本集合中,这些数据成为袋外数据(OOB),它可以用于作为测试集。

四、随机森林
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
五、投票机制
在这里插入图片描述
六、样本不均衡处理方法
在这里插入图片描述
降采样可能较过采样好一些,速度快、不易受噪声影响。

七、随机森林的几个应用
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
异常点应该很容易被分开,因此根到叶子长度特别短,很可能是异常点。
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值