随机森林_袋外错误率(OOB error)

在随机森林bagging法中可以发现booststrap每次约有1/3的样本不会出现在bootstrap所采集的样本集合中,故没有参加决策树的建立,这些数据称为袋外数据oob,用于取代测试集误差估计方法,可用于模型的验证。
下面先介绍下oob的使用,其中(x,y)代表输入的样本和label,g表示的是构建的树。
在这里插入图片描述
构建随机森林的关键问题就是如何选择最优的m(从总量为M的特征向量中,随机选择m个特征),要解决这个问题主要依据计算袋外错误率。
  随机森林有一个重要的优点就是,没有必要对它进行交叉验证或者用一个独立的测试集来获得误差的一个无偏估计。它可以在内部进行评估,也就是说在生成的过程中就可以对误差建立一个无偏估计。
  在构建每棵树时,我们对训练集使用了不同的bootstrap sample(随机且有放回地抽取)。所以对于每棵树而言(假设对于第k棵树),大约有1/3的训练实例没有参与第k棵树的生成,它们称为第k棵树的袋外样本数据。
而这样的采样特点就允许进行袋外估计,它的计算方式如下:
  a. 对每个样本,计算它作为袋外样本的树对它的分类情况(约1/3的树);
  b. 然后以简单多数投票作为该样本的分类结果;
  c. 最后用误分个数占样本总数的比率作为随机森林的袋外错误率。

参考链接:https://www.jianshu.com/p/b94ec2fc345d

  • 3
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值