数据挖掘 - 模型融合

最新推荐文章于 2021-09-15 17:36:36 发布

Jian_h

最新推荐文章于 2021-09-15 17:36:36 发布

阅读量349

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jian_h/article/details/105317191

版权

本文介绍了数据挖掘中的模型融合技术，包括简单加权融合、stacking/blending及boosting/bagging。简单加权融合通过平均或投票方式结合模型预测。stacking通过构建多层模型，使用基学习器的预测结果训练新模型。boosting和bagging是多树方法，bagging采用有放回抽样，boosting则关注分类错误样例，逐步提高模型性能。

摘要由CSDN通过智能技术生成

“如果你没有什么好的思路的话，那么就模型融合吧！”

1. 简单加权融合:

回归（分类概率）：算术平均融合（Arithmetic mean），几何平均融合（Geometric mean）；

对于回归问题，一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。权值可以用排序的方法确定，举个例子，比如A、B、C三种基本模型，模型效果进行排名，假设排名分别是1，2，3，那么给这三个模型赋予的权值分别是3/6、2/6、1/6

分类：投票（Voting)：假设对于一个二分类问题，有3个基础模型，那么就采取投票制的方法，投票多者确定为最终的分类。投票的模型越多，那么显然其结果将会更好。但是其前提条件是模型之间相互独立，结果之间没有相关性。越相近的模型进行融合，融合效果也会越差。

综合：排序融合(Rank averaging)，log融合

Bagging或者Boosting都是一种把许多弱分类器这样融合成强分类器的思想。

2. stacking/blending:

构建多层模型，并利用预测结果再拟合预测。

简单来说 stacking 就是当用初始训练数据学习出若干个基学习器后，将这几个学习器的预测结果作为新的训练集，来学习一个新的学习器。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。