集成学习:是目前机器学习的一大热门方向,所谓集成学习简单理解就是指采用多个分类器对数据集迚行预测,从而提高整体分类器的泛化能力
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/d2a470052bd9db32ae3e6269a984907b.png)
bagging
通过抽样算法,抽出n个子训练集,训练n个基模型。
测试集通过n个基模型进行预测,最后投票组合出最后结果。
基模型要选强模型。
boosting
在每一步选取最合适模型,进入下一步针对上一步的错误数据的权重会提高,针对上一步没有解决的问题,选取一个合适的模型。
基模型选弱模型。
stacking
把所有基模型的产生的结果拼接成一个新的向量,作为下一级模型的输入。