集成学习下 02 stacking集成学习算法

本文介绍了Stacking集成学习算法的思想和实现步骤,包括数据集划分、基模型预测及次级学习器训练。通过示例展示了如何使用mlxtend工具包进行Stacking,并给出了最佳参数和准确率。
摘要由CSDN通过智能技术生成

集成学习下 02 stacking集成学习算法

开源学习地址:datawhale

1.Stacking

stacking的思想从blending发展而来,具体思路如下:
1.首先将所有数据集生成测试集和训练集(假设训练集为10000,测试集为2500行),对训练集进行五折交叉验证,使用训练集中8000条作为训练集,剩余2000作为验证集。
2.每次验证相当于使用蓝色的8000条数据训练出一个模型,使用模型对验证集进行验证得到2000条数据,并对测试集进行预测,得到2500条数据。经过五次交叉验证,可以得到5个2000条验证集的结果,5个2500条测试集的预测结果。
3.将验证集的5个2000条预测结果拼接保存为新的training data,记为 A 1 A_1 A1,对5个2500行的测试集的预测结果进行加权平均,得到一个2500行的矩阵,记为 B 1 B_1 B1
4.上面得到一个基模型在数据集上的预测结果 A 1 、 B 1 A_1、B_1 A1B1,当对3个基模型进行集成,则得到 A 1 、 A 2 、 A 3 、 B 1 、 B 2 、 B 3 A_1、A_2、A_3、B_1、B_2、B_3 A1A2A3B1B2B3六个矩阵。
5.对六个矩阵分别进行拼接,合并

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值