【机器学习】Adaboost

DonngZH

已于 2023-02-21 09:45:36 修改

阅读量7.3k

点赞数 1

分类专栏：人工智能深度学习机器学习文章标签：机器学习 python 人工智能

于 2023-02-20 15:25:12 首次发布

本文链接：https://blog.csdn.net/weixin_44750512/article/details/128973138

版权

深度学习同时被 3 个专栏收录

74 篇文章 41 订阅

订阅专栏

人工智能

53 篇文章 5 订阅

订阅专栏

机器学习

21 篇文章 2 订阅

订阅专栏

Adaboost是一种Boosting方法，通过改变训练样本权重学习多个弱分类器，并组合成强分类器。它初始化样本权值，训练弱分类器，并依据错误率调整权重，最后通过加权多数表决集成。优点包括灵活性高、精度提升，但易受噪声样本影响且依赖弱分类器训练时间。

摘要由CSDN通过智能技术生成

1.什么是Adaboost

AdaBoost（adapt boost），自适应推进算法，属于Boosting方法的学习机制。是一种通过改变训练样本权重来学习多个弱分类器并进行线性结合的过程。它的自适应在于：被前一个基本分类器误分类的样本的权值会增大，而正确分类的样本的权值会减小，并再次用来训练下一个基本分类器。同时，在每一轮迭代中，加入一个新的弱分类器，直到达到某个预定的足够小的错误率或预先指定的最大迭代次数再确定最后的强分类器。Adaboost主要解决的问题有: 两类问题、多类单标签问题、多类多标签问题、回归问题。

2.Adaboost算法流程

2-1 权值初始化

初始化训练数据的权值分布D1。假设有N个训练样本数据，则每一个训练样本最开始时，都会被赋予相同的权值：w1 = 1/N。

2-2 训练弱分类器

训练弱分类器Ci。训练过程中提高被弱分类器错分样本的权值，降低正分样本的权值，作为下一轮基本分类器的训练样本。这样一来，那些没有得到正确分类的数据，由于其价值加大后收到后一轮弱分类器的更大关注，于是，分类问题被一系列弱分类器"分而治之"。具体训练过程：如果某个训练样本点，被弱分类器Ci准确地分类，那么再构造下一个训练集中，它对应的权值要减小；相反，如果某个训练样本点被错误分类，那么它的权值就应该增大。权值的更新过的样本被用于训练下一个弱分类器，整个过程如此迭代下去。

第一个分类器将三个蓝色样本错误分类到红色样本区域，所以将蓝色样本的权值增大，作为第二个分类器的训练数据。