机器学习算法学习---模型融合和提升的算法（五）

最新推荐文章于 2024-09-17 16:52:57 发布

weixin_34040079

最新推荐文章于 2024-09-17 16:52:57 发布

阅读量143

点赞数

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/zhenpengwang/p/10894599.html

版权

Blending的优点在于：
1.比stacking简单（因为不用进行k次的交叉验证来获得stacker feature）
2.避开了一个信息泄露问题：generlizers和stacker使用了不一样的数据集
3.在团队建模过程中，不需要给队友分享自己的随机种子
而缺点在于：
1.使用了很少的数据
2.blender可能会过拟合（其实大概率是第一点导致的）
3.stacking使用多次的CV会比较稳健

bending是一种模型融合方法，对于一般的blending，主要思路是把原始的训练集先分成两部分，比如70%的数据作为新的训练集，剩下30%的数据作为测试集。第一层我们在这70%的数据上训练多个模型，然后去预测那30%数据的label。在第二层里，我们就直接用这30%数据在第一层预测的结果做为新特征继续训练即可。

python实现：

https://github.com/emanuele/kaggle_pbr

转载于:https://www.cnblogs.com/zhenpengwang/p/10894599.html