区别:
1、样本选择上。bagging使用自助采样方法每轮抽取局部数据训练基模型,boosting使用全部样本训练基模型。
2、样例权重。bagging中每个样本所占的权重是一样的,boosting中开始时样本权重一样,但在每轮的训练中会减小分类正确的样本的权重,增大分类错误的样本的权重。
3、模型是否并行。bagging可以并行训练模型,boosting不能并行,一个模型训练完成之后才能训练下一个模型。
4、基模型的结合策略不同。bagging是通过投票(分类时)或求均值(回归),基模型的重要性相同。boosting是将基模型加权融合,基模型的重要性不同。
5、降低方差还是偏差。bagging通过降低方差,boosting依靠降低偏差来提升预测精度。boosting逐步地最小化损失函数,逐步降低偏差,但由于各个基模型之间是强相关的,基模型之和不能显著降低方差。(随机森林与bagging的区别,随机森林有特征采样,每个基模型使用随机选取的部分特征进行训练)
联系:
1、都是通过基模型结合获得强模型的集成方法。
2、基模型的类别一般来说是一样的。