学习目标:
- 学习融合策略
- 完成相应学习打卡任务
学习内容:
模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式:
1、简单加权融合:
回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);
分类:投票(Voting)
2、boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):
多树的提升方法
3、stacking/blending:
构建多层模型,并利用预测结果再拟合预测。
相关理论介绍:
1、简单加权融合
- 平均法-Averaging
对于回归问题,一个简单直接的思路是取平均。将多个模型的回归结果取平均值作为最终预测结果,进而把多个弱分类器荣和城强分类器。
稍稍改进的方法是进行加权平均,权值可以用排序的方法确定,举个例子,比如A、B、C三种基本模型,模型效果进行排名,假设排名分别是1,2,3,那么给这三个模型赋予的权值分别是3/6、2/6、1/6。
平均法或加权平均法看似简单,其实后面的高级算法也可以说是基于此而产生的,Bagging或者Boosting都是一种把许多弱分类器