集成学习基础知识一(Bagging和Boosting的区别以及Boosting(Adaboost)的过程与实例)

在集成算法中主要分为bagging算法(英文翻译是套袋)和boosting算法(英文翻译是提升)
Bagging算法的过程如下:

  1. 从原始样本集中使用Bootstarping方法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集(k个训练集之间相互独立,元素可以有重复)。
  2. 对于n个训练集,我们训练k个模型,(这个模型可根据具体的情况而定,可以是决策树,knn)
  3. 对于分类问题:由投票表决产生分类结果;对于回归问题,由k个模型预测结果均值作为最后预测的结果(所有的模型的重要性相同)

Boosting算法的过程如下

  1. 对于训练集中的每个样本建立权值wi,表示对每个样本的权重,其关键在与对于被错误分类的样本权重会在下一轮的分类中获得更大的权重(错误分类的样本的权重增加),这样做的目的就是使得错误分类的样本可以受到更多的关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直至基学习器数目达到指定的值T,或者集成效果达到退出条件,然后将这些学习器进行加权结合。
  2. 同时加大分类误差概率小的弱分类器的权值,使其在表决中起到更大的作用,减少分类误差率较大的弱分类器的权值,使其在表决中起到较小的作用。每一次迭代都得到一个弱分类器,需要使用某种策略将其组合,作为最终模型,(ababoost给每次迭代之后的弱分类器一个权值,将其线性组合作为最终的分类器,误差小的分类器权重越大)

Bagging和Boosting的主要区别:

  • 样本选择上:Bagging采取Booststraping随机有放回的取样,Boosting的每一轮训练的样本是固定的,改变的是分类器的权重。
  • 样本权重上:Bagging采取的是均匀取样,且每个样本权重相同,Boosting根据错误率调整样本权重,错误率越大的样本权重会越大,错误率小的样本权重会变小,
  • 预测函数上:Bagging中预测函数权重相同,Boosting中误差越小的预测函数其权重越大。
  • 并行计算:Bagging的各个预测函数可以并行生成;Boosting的各个预测函数必须按照顺序迭代生成。

下面给出AdaBoost算法的流程图,一看就懂(哈哈)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
一个实例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
AdaBoost算法为加法模型损失函数为指数函数学习算法为前向分布算法的二分类算法。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. Bagging、随机森林和boosting都是集成学习方法,它们的目的都是通过组合多个弱学习器来构建一个强学习器。它们的主要区别在于: - Baggingbootstrap aggregating):通过随机从原始数据集中有放回地采样得到多个子集,然后使用这些子集训练多个弱学习器,最后通过投票或平均等方式来集成这些弱学习器,从而得到一个强学习器。 - 随机森林:随机森林是一种特殊的Bagging方法,它采用决策树作为弱学习器,并在构建每个决策树时,随机选择一部分特征进行训练,从而增加了模型的多样性。 - Boosting:通过迭代地训练多个弱学习器,每次训练都根据上一轮的结果调整样本权重,使得分类错误的样本得到更高的权重,从而使得下一轮的弱学习器更加关注分类错误的样本。最后将所有弱学习器的预测结果加权求和得到最终的预测结果。 2. AdaboostAdaptive Boosting)是一种常用的Boosting方法,在训练过程中,它根据上一轮的结果调整样本权重,并且根据弱学习器的表现来调整每个弱学习器的权重。具体过程如下: - 初始化样本权重为相等值,并选择一个弱学习器作为初始模型。 - 对于每一轮: - 使用当前样本权重训练一个弱学习器,并根据其在训练集上的表现计算其权重。 - 根据弱学习器的权重,更新样本权重。对于分类错误的样本,其权重会增加;对于分类正确的样本,其权重会减少。 - 最终将所有弱学习器的预测结果加权求和得到最终的预测结果。 Adaboost的优点在于它可以提高模型的分类精度,并且能够有效地处理高维数据的分类问题。但是它也有一些缺点,比如对异常值比较敏感,需要较长的训练时间等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值