数据挖掘-金融风控-模型融合05

最新推荐文章于 2022-02-24 19:59:05 发布

慕安春临

最新推荐文章于 2022-02-24 19:59:05 发布

阅读量215

点赞数

分类专栏：数据挖掘-金融风控

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuhong_001/article/details/108827095

版权

数据挖掘-金融风控专栏收录该内容

5 篇文章 0 订阅

订阅专栏

金融风控-模型融合

模型融合是比赛后期上分的重要手段，特别是多人组队学习的比赛中，将不同队友的模型进行融合，可能会收获到意象不到的效果，往往模型相差越大且模型表现都不错的情况下，模型融合后结果会有很大的提升，主要的融合人方式有：

平均
简单平均
加权平均
投票
简单投票法
加权投票
综合
排序融合
log融合
stacking
构建多层模型，并利用预测结果在拟合预测
blending
选取部分数据预测训练得到预测结果作为新特征，代入剩下的数据中预测

stacking、blending详解

stacking将若干基学习器获得的预测结果，将预测结果作为新的训练集来训练一个学习器，将数据代入五基学习器中得到预测结果，在代入到模型六中进行训练预测。
但是，由于直接将五基学习器中的结果代入到模型六中，容易导致过拟合，所以在使用五集模型进行预测时，可以考虑使用k折验证，防止过拟合。
blending与stacking不同，blending时将预测的值作为新的特征和原特征进行合并，构成新的特征值，用于预测。为了防止过拟合，将数据分为两个部分d1，d2，使用d1的数据集作为训练集，d2数据集作为测试集。预测得到的数据作为新特征使用d2的数据作为训练集结合新特征，预测测试集的结果。
blending与stacking的不同
stacking

satcking中由于两层使用的数据不同，所以可以避免信息泄露的问题
在组队竞赛的过程中，不需要给队友分享自己的随机种子

blending

由于blending对数据划分为两个部分，在最后预测时有部分信息将被忽略
同时在使用的第二层数据可能会因为第二层数据减少产生过拟合现象

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。