集成学习---Stacking

最新推荐文章于 2023-04-14 23:12:32 发布

l_d_x

最新推荐文章于 2023-04-14 23:12:32 发布

阅读量305

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/l_d_x/article/details/116771967

版权

使用Stacking集成学习方法对鸢尾花数据集进行分类

1. 加载数据

from sklearn import datasets
iris = datasets.load_iris()
X, y = iris.data[:, 1:3], iris.target

2.构建Stacking分类器

from sklearn.model_selection import cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB 
from sklearn.ensemble import RandomForestClassifier
from mlxtend.classifier import StackingCVClassifier
from sklearn.model_selection import GridSearchCV
RANDOM_SEED = 42
clf1 = KNeighborsClassifier(n_neighbors=1)
clf2 = RandomForestClassifier(random_state=RANDOM_SEED)
clf3 = GaussianNB()
lr = LogisticRegression()
sclf = StackingCVClassifier(classifiers=[clf1, clf2, clf3],  # 第一层分类器
                            use_probas=True,
                            meta_classifier=lr,   # 第二层分类器
                            random_state=RANDOM_SEED)

除了sklearn包之外，还需要import mlxtend包。代码中构建了三个基本分类器clf1,clf2和clf3，第二层分类器是一个逻辑回归网络。use_probas = True,表明将第一层分类器输出的概率作为第二层的输入。

3.使用5折交叉验证和网格搜索

params = {'kneighborsclassifier__n_neighbors': [1, 5],
          'randomforestclassifier__n_estimators': [10, 50],
          'meta_classifier__C': [0.1, 10.0]}

grid = GridSearchCV(estimator=sclf, 
                    param_grid=params, 
                    cv=5,
                    refit=True)
grid.fit(X, y)

cv_keys = ('mean_test_score', 'std_test_score', 'params')

for r, _ in enumerate(grid.cv_results_['mean_test_score']):
    print("%0.3f +/- %0.2f %r"
          % (grid.cv_results_[cv_keys[0]][r],
             grid.cv_results_[cv_keys[1]][r] / 2.0,
             grid.cv_results_[cv_keys[2]][r]))

print('Best parameters: %s' % grid.best_params_)
print('Accuracy: %.2f' % grid.best_score_)

使用网格搜索可以在给定的参数组合中找出精度最高的结果对应的参数。

l_d_x

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集成学习---Stacking

使用Stacking集成学习方法对鸢尾花数据集进行分类1. 加载数据from sklearn import datasetsiris = datasets.load_iris()X, y = iris.data[:, 1:3], iris.target2.构建Stacking分类器from sklearn.model_selection import cross_val_scorefrom sklearn.linear_model import LogisticRegression
复制链接

扫一扫