a1集成学习上-08Bagging的原理和案例分析-202104

Bagging是一种集成学习方法,通过自助采样构建多个训练集合,训练基学习器并结合它们的预测结果。它适用于降低方差,尤其在决策树和神经网络上效果显著。在分类问题中, Bagging通过多数投票决定最终预测。实战训练显示,Bagging模型在随机生成的分类数据集上的Accuracy为0.856,标准差0.037。
摘要由CSDN通过智能技术生成

1bagging的原理

1.1bagging的核心要义

Bagging的核心在于自助采样(bootstrap)这一概念,即有放回的从数据集中进行采样。
一个自助采样的小例子:希望估计全国所有人口年龄的平均值,那么可以在全国所有人口中随机抽取不同的集合(这些集合可能存在交集),计算每个集合的平均值,然后将所有平均值的均值作为估计值。

1.2bagging的基本流程

(1)随机取出一个样本放入采样集合中
(2)再把这个样本放回初始数据集,重复K次采样
(3)最终我们可以获得一个大小为K的样本集合。
(4)同样的方法, 我们可以采样出T个含K个样本的采样集合,然后基于每个采样集合训练出一个基学习器,再将这些基学习器进行结合,这就是Bagging的基本流程。

1.3bagging的适用情况

(1)是一种降低方差的技术,在不剪枝决策树、神经网络等易受样本扰动的学习器上效果更加明显。
(2)在实际的使用中,加入列采样的Bagging技术对高维小样本往往有神奇的效果。

1.3bagging的特点

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值