python stacking_详解 Stacking 的 python 实现

weixin_39959349

于 2020-12-23 08:02:12 发布

阅读量138

点赞数

文章标签： python stacking

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39959349/article/details/111897606

版权

本文介绍了Stacking的概念，通过Python代码展示了如何使用RandomForestClassifier, ExtraTreesClassifier, GradientBoostingClassifier作为基学习器，利用k折交叉验证训练第一层学习器，并训练第二层的LogisticRegression。详细阐述了从数据预处理到最终模型评估的完整过程。" 113413281,10536274,利用电离层延迟预测的自适应卡尔曼滤波周跳检测,"['导航定位', '信号处理', '滤波算法', '电离层研究', '卫星通信']

摘要由CSDN通过智能技术生成

1. 什么是 stacking

stacking 就是当用初始训练数据学习出若干个基学习器后，将这几个学习器的预测结果作为新的训练集，来学习一个新的学习器。

2. 代码：

例如我们用 RandomForestClassifier, ExtraTreesClassifier, GradientBoostingClassifier 作为第一层学习器：# Our level 0 classifiers

clfs = [

RandomForestClassifier(n_estimators = n_trees, criterion = 'gini'),

ExtraTreesClassifier(n_estimators = n_trees * 2, criterion = 'gini'),

GradientBoostingClassifier(n_estimators = n_trees),

]

接着要训练第一层学习器，并得到第二层学习器所需要的数据，这里会用到 k 折交叉验证。

1. 先用初始训练集训练 clf，并得到第二层的训练数据 blend_train：

第 j 个学习器，共经过 nfolds 次交叉验证，每一次会得到当前验证集角标上的预测值，nfolds 之后得到和初始训练集一样大小的集合：

blend_train[cv_index, j] = clf.predict(X_cv)

2. 再用 clf 对 test 集进行预测

最低0.47元/天解锁文章

weixin_39959349

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。