[集成学习]Bagging集成

Bagging集成

  • Boostrap抽样

对于线性模型
在这里插入图片描述
从抽样总体中抽出一个容量为n的样本,通过这n个数据得到参数Beta1的一个估计值。将该过程重复k次(自助采样),可以得到k个Beta1的估计值,利用公式在这里插入图片描述可以求得Beta1的方差,以衡量该线性模型的波动性

  • Bagging集成
    Bagging集成以boostrap抽样为基础。在得到beta1的k个估计值后,可以通过k个样本集得到k个y的预测值,取k个y的估计值的平均值作为最终预测值。(对于回归问题来说,最终预测值是取k个预测值的平均值,但对于分类问题来说,哪一类的次数出现最多,最终预测值就是哪一类)

作业

1.什么是boostraps?
boostraps是一种通过自助采样来估计模型参数的方差的方法,用于衡量模型的波动性。
2.boostraps与bagging的联系
bagging是以boostraps为基础的集成方法。

4.随机森林与bagging的联系与区别
联系:随机森林与bagging都包含了boostraps的思想
区别:随机森林除了要对样本进行采样外,还要对特征进行采样,与bagging相比,方差进一步减小。
5.使用方差与偏差理论阐述为什么bagging能提升模型的预测精度
测试误差=方差+偏差²,由于bagging中是通过求多个估计值的平均值来作为结果的,故最终结果的方差是σ²/n,是估计值方差的1/n.又因为方差与偏差成反比,当方差减小时,偏差增大,当方差增大时,偏差减小,故最终结果的偏差会增大。但当偏差的增加量小于方差的减小量时,模型的精度会提高。

6.请尝试使用bagging与基本分类模型或回归模型做对比,观察bagging是否相对于基础模型的精度有所提高

参考:
[1]https://github.com/datawhalechina/ensemble-learning
[2]https://www.bilibili.com/video/BV1Mb4y1o7ck?t=360&p=27

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值