StackingClassifier

最新推荐文章于 2024-07-03 08:00:00 发布

奥特曼不秃头

最新推荐文章于 2024-07-03 08:00:00 发布

阅读量9.7k

点赞数 5

分类专栏：机器学习文章标签：机器学习 stacking

本文链接：https://blog.csdn.net/github_35965351/article/details/60763606

版权

本文介绍了StackingClassifier的概念，这是一种集成学习技术，通过元分类器结合多个分类模型的输出进行预测。文章详细讲解了StackingClassifier的工作流程，并提供了几个示例，包括基础用法、使用概率作为特征以及与GridSearch的结合。此外，还列出了相关API的说明，帮助理解如何使用StackingClassifier。

摘要由CSDN通过智能技术生成

写在前面

scikit-learn 官网的Ensemble methods 文档部分只介绍了/bagging / boosting / voting / 三种模型组合方式;但是通过查找学习，受周志华《机器学习》集成学习部分的学习法启发，了解并学习了 stacking，在此以作记录。

概述

Stacking 是一种集合学习技术，通过元分类器组合多个分类模型。基于完整训练集训练各个分类模型; 然后，基于整体中的各个分类模型的输出 - 元特征来拟合元分类器。元分类器可以根据预测类标签或来自集合的概率进行训练。

流程图：

OR
这里写图片描述

算法总结：
这里写图片描述

下面直接上实现过程

环境

ubantu 16.04 + jupyter + python2.7
scikit-learn + mlxtend + anconda

示例1.基础StackingClassifier

from sklearn import model_selection
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB 
from sklearn.ensemble import RandomForestClassifier
from mlxtend.classifier import StackingClassifier
import numpy as np

clf1 = KNeighborsClassifier(n_neighbors=1)
clf2 = RandomForestClassifier(random_state=1)
clf3 = GaussianNB()
lr = LogisticRegression()
sclf = StackingClassifier(classifiers=[clf1, clf2, clf3], 
                          meta_classifier=lr)

print('3-fold cross validation:\n')

for clf, label in zip([clf1, clf2, clf3, sclf], 
                      ['KNN', 
                       'Random Forest', 
                       'Naive Bayes',
                       'StackingClassifier']):

    scores = model_selection.cross_val_score(clf, X, y, 
                                              cv=3, scoring='accuracy')
    print("Accuracy: %0.2f (+/- %0.2f) [%s]" 
          % (scores.mean(), scores.std(), label))

3-fold cross validation:

Accuracy: 0.91 (+/- 0.01) [KNN]

最低0.47元/天解锁文章

奥特曼不秃头

关注

5
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录