- 这篇博文是 DataWhale集成学习【下】 的第二部分,主要是介绍Stacking的思想原理以及实现应用
- 参考资料为DataWhale开源项目:机器学习集成学习与模型融合(基于python)和scikit-learn官网
- 学习交流欢迎联系 obito0401@163.com
原理
- 上篇提到的 blending 在集成的过程中只用到了验证集的数据,对数据来说是一个很大的浪费,而且容易造成过拟合
- stacking 正是为了解决该问题而产生的,通过交叉验证的方式对 blending 的缺陷进行弥补,进而提高效果
- stacking 严格来说并不是一种算法,而是一种精美而复杂的对模型进行集成的一种策略
方法
示例
<因近段精力有限,代码部分应该在5月补充完毕>