金融风控训练营task5学习笔记
Task5 模型融合
一、知识点概括
将之前建模调参的结果进行模型融合。 尝试多种融合方案,提交融合结果并打卡。(模型融合一般用于A榜比赛的尾声和B榜比赛的全程)
二、学习内容
1.平均:
1)简单平均法:就是将所有需要融合的因素的百分比相加之后除以总个数。
优点:模型简单,计算简便。
缺点:将预测对象的波动平均化了,因而不能反映预测对象的变化趋势,所以该方法只适合对比较稳定的企业波动不大的预测对象使用。
2)加权平均法:就是自行给各个因素加以不同权重,然后求其平均值。
优点:可以根据之前准确率,得出更加准确的模型
缺点:若是判断失误,则容易得出更加不准确的模型
2.投票:简单投票法 加权投票法
3.综合:排序融合 log融合
4.stacking:构建多层模型,并利用预测结果再拟合预测。
5.blending:选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。
6.boosting/bagging(在Task4中已经提及,就不再赘述)
三、代码示例
另外来自一部分来自于百度百科