scikit-learn中BaggingClassifier参数

敲键盘的大蚂蚁

于 2020-01-20 19:40:42 发布

阅读量8.3k

点赞数 4

文章标签：决策树算法机器学习深度学习 python

本文链接：https://blog.csdn.net/Asdas_/article/details/104055529

版权

BaggingClassifier是scikit-learn中的元估计器，通过在随机子集上训练多个基估计器（如决策树）来降低模型方差，减少过拟合。主要参数包括base_estimator（默认为决策树）、n_estimators（默认为10）、max_samples和max_features（控制采样比例）、bootstrap（默认为True，表示有放回抽样）、oob_score（默认为False，是否计算未采样样本的预测误差）等。

摘要由CSDN通过智能技术生成

Bagging 元估计器

我们先来看一下官方文档中,对Bagging的解释:

在集成算法中，bagging 方法会在原始训练集的随机子集上构建一类黑盒估计器的多个实例，然后把这些估计器的预测结果结合起来形成最终的预测结果。该方法通过在构建模型的过程中引入随机性，来减少基估计器的方差(例如，决策树)。在多数情况下，bagging 方法提供了一种非常简单的方式来对单一模型进行改进，而无需修改背后的算法。因为 bagging 方法可以减小过拟合，所以通常在强分类器和复杂模型上使用时表现的很好（例如，完全生长的决策树，fully developed decision trees），相比之下 boosting 方法则在弱模型上表现更好（例如，浅层决策树，shallow decision trees）。

而在 scikit-learn 中，bagging 方法使用统一的 BaggingClassifier 元估计器.

class sklearn.ensemble.BaggingClassifier(base_estimator=None, n_estimators=10, max_samples=1.0, max_features=1.0, bootstrap=T

最低0.47元/天解锁文章

敲键盘的大蚂蚁

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫