Datawhale 集成学习 Task08：Bagging的原理和案例分析

最新推荐文章于 2022-11-05 01:00:00 发布

Andrew_zjc

最新推荐文章于 2022-11-05 01:00:00 发布

阅读量176

点赞数

分类专栏：笔记文章标签：机器学习

本文链接：https://blog.csdn.net/Andrew_zjc/article/details/115802320

版权

笔记专栏收录该内容

32 篇文章 3 订阅

订阅专栏

关于bagging，这是一种集成学习的方法，它的老对手是boosting。他俩有个原始的祖宗是投票法（因为投票法最好想到也最好理解）。我经常把他俩弄混，主要是这两个英文单词总是让我浮想联翩。今天来捋一捋，表达了两种先进的集成学习思路，bagging一条是大家一起干活大佬随机翻牌翻到谁“叼”谁，boosting还有一条是大家流水线干活大佬在线旁边“叼”人。明显前者适合并行。

本次学习bagging的主要代码为以下，

import numpy as np
from sklearn import datasets
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import RepeatedStratifiedKFold
from sklearn.ensemble import BaggingClassifier
X, y = datasets.make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, random_state=5)
model = BaggingClassifier()
cv = RepeatedStratifiedKFold(n_splits=10, n_repeats=3, random_state=1)
n_scores = cross_val_score(model, X, y, scoring='accuracy', cv=cv, n_jobs=-1, error_score='raise')
print('Accuracy: %.3f Std:(%.3f)' % (np.mean(n_scores), np.std(n_scores)))

保存为后缀py的文件，python解释器运行结果如下：
在这里插入图片描述

用前几堂课学到的matplot绘制方法，看下X和y到底长啥样。怎一个哇塞了得，传统的分类方法估计很难理清楚谁是谁了。
在这里插入图片描述

Andrew_zjc

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Datawhale 集成学习 Task08：Bagging的原理和案例分析

关于bagging，这是一种集成学习的方法，它的老对手是boosting。他俩有个原始的祖宗是投票法（因为投票法最好想到也最好理解）。我经常把他俩弄混，主要是这两个英文单词总是让我浮想联翩。今天来捋一捋，表达了两种先进的集成学习思路，bagging一条是大家一起干活大佬随机翻牌翻到谁“叼”谁，boosting还有一条是大家流水线干活大佬在线旁边“叼”人。明显前者适合并行。本次学习bagging的主要代码为以下，import numpy as npfrom sklearn import datasets
复制链接

扫一扫