Datawhale 零基础入门数据挖掘-Task5 模型融合

最新推荐文章于 2022-11-01 16:01:55 发布

A half moon

最新推荐文章于 2022-11-01 16:01:55 发布

阅读量88

点赞数

分类专栏：数据科学

本文链接：https://blog.csdn.net/weixin_44064434/article/details/105316646

版权

数据科学专栏收录该内容

28 篇文章 0 订阅

订阅专栏

Datawhale 零基础入门数据挖掘-Task5 模型融合

参考文章
模型融合是比赛后期一个重要的环节，大体来说有如下的类型方式。

1. 简单加权融合:

回归（分类概率）：算术平均融合（Arithmetic mean），几何平均融合（Geometric mean）；
分类：投票（Voting)
综合：排序融合(Rank averaging)，log融合

2. stacking/blending:

构建多层模型，并利用预测结果再拟合预测。

3. boosting/bagging（在xgboost，Adaboost,GBDT中已经用到）:

多树的提升方法

在这里插入图片描述

将个体学习器结合在一起的时候使用的方法叫做结合策略。对于分类问题，我们可以使用投票法来选择输出最多
的类。对于回归问题，我们可以将分类器输出的结果求平均值。
上面说的投票法和平均法都是很有效的结合策略，还有一种结合策略是使用另外一个机器学习算法来将个体机器
学习器的结果结合在一起，这个方法就是Stacking。
在stacking方法中，我们把个体学习器叫做初级学习器，用于结合的学习器叫做次级学习器或元学习器（meta-
learner），次级学习器用于训练的数据叫做次级训练集。次级训练集是在训练集上用初级学习器得到的。

在这里插入图片描述