Bagging 模型为什么要进行抽样？

最新推荐文章于 2025-04-27 14:23:12 发布

Amanda_ABAP_Python

最新推荐文章于 2025-04-27 14:23:12 发布

阅读量807

点赞数 1

分类专栏： python 数据分析人工智能文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Amanda_python/article/details/111595091

版权

python 同时被 3 个专栏收录

101 篇文章

订阅专栏

75 篇文章

订阅专栏

66 篇文章

订阅专栏

本文解释了Bagging模型中为何要进行抽样，介绍了有放回抽样与无放回抽样的区别，阐述了包外数据的概念及其用途，并解析了Bagging模型能够实现并行化的原因。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.Bagging 模型为什么要进行抽样？

Bagging 模型是基于同样类型的基学习器进行集成学习，如果不进行
抽样，那么所有的基学习器都学习了同样的数据，模型之间就没有不
同，模型必须具有一定的差异性，才能更大程度提升整个模型的准确
度，通过数据抽样的方式，让基学习器学习不同的数据，从而生成具
有差异性的基学习器。

2.有放回抽样和无放回抽样的区别是什么？

有放回抽样：在一轮抽样期间，每次抽完一个数据，就立马将该数据放回。
如果一轮要抽样n个数据，那么就会有n次数据的放回动作。

无放回抽样：数据只有到一轮抽样结束后，才可能被放回。

3.什么是包外数据？它有什么用处？

如果采用有放回的抽样方式，那么通过概率学统计，大概有 37%的数据会
一直没有被抽取到。这些数据被称为包外数据，他们可以用来对模型进行
预测和评估。使用oob_score属性来进行测试计算得分

4.Bagging 为什么可以做并行化运行？

Bagging 的基学习器之间是相互独立，没有依赖关系的，所以可以做 
并行化。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。