集成学习基础知识一（Bagging和Boosting的区别以及Boosting（Adaboost）的过程与实例）

最新推荐文章于 2022-03-30 18:36:48 发布

明白的愚

最新推荐文章于 2022-03-30 18:36:48 发布

阅读量853

点赞数

文章标签：算法机器学习

本文链接：https://blog.csdn.net/weixin_43924687/article/details/119349959

版权

在集成算法中主要分为bagging算法（英文翻译是套袋）和boosting算法（英文翻译是提升）
Bagging算法的过程如下：

Boosting算法的过程如下：

对于训练集中的每个样本建立权值wi，表示对每个样本的权重，其关键在与对于被错误分类的样本权重会在下一轮的分类中获得更大的权重（错误分类的样本的权重增加），这样做的目的就是使得错误分类的样本可以受到更多的关注，然后基于调整后的样本分布来训练下一个基学习器；如此重复进行，直至基学习器数目达到指定的值T，或者集成效果达到退出条件，然后将这些学习器进行加权结合。
同时加大分类误差概率小的弱分类器的权值，使其在表决中起到更大的作用，减少分类误差率较大的弱分类器的权值，使其在表决中起到较小的作用。每一次迭代都得到一个弱分类器，需要使用某种策略将其组合，作为最终模型，(ababoost给每次迭代之后的弱分类器一个权值，将其线性组合作为最终的分类器，误差小的分类器权重越大)

Bagging和Boosting的主要区别：

下面给出AdaBoost算法的流程图，一看就懂（哈哈）
在这里插入图片描述

一个实例：

AdaBoost算法为加法模型、损失函数为指数函数、学习算法为前向分布算法的二分类算法。

关注