机器学习实战——集成学习 Adaboost 算法

最新推荐文章于 2025-05-01 16:58:07 发布

wxw_csdn

最新推荐文章于 2025-05-01 16:58:07 发布

阅读量663

点赞数

分类专栏：机器学习文章标签：集成学习 Adaboost sklearn AdaBoostClassifier

本文链接：https://blog.csdn.net/wxw_csdn/article/details/84835886

版权

本文详细介绍了集成学习中的Adaboost算法，包括其作为加法模型和指数损失函数的学习算法，以及在sklearn中的具体实现。Adaboost通过结合多个弱学习器形成强学习器，常使用的弱学习器为决策树。在sklearn中，AdaBoostClassifier提供了SAMME和SAMME.R两种算法，可以调整如n_estimators和learning_rate等参数以优化模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 模型介绍

1.1 集成学习概述

集成学习通过构建并结合多个学习器来完成学习任务。对于训练集数据，我们通过训练若干个个体学习器，通过一定的结合策略，最终可以形成一个强学习器，以达到博采众长的目的。即如下图：

集成学习需要解决两个主要的问题：
1 个体学习器如何获得；
2 如何选择个体学习器的结合策略。
目前个体学习器的选择有两种方式，第一种是所有的个体学习器都是一个种类的，或者说是同质的，比如都是决策树、神经网络；第二种是所有的个体学习器不全是一个种类的，或者说是异质的。比如个体学习器包含有支持向量机、逻辑回归、朴素贝叶斯。
目前，同质个体学习器的应用是最广泛的，一般我们常说的集成学习的方法都是指同质个体学习器，在同质个体学习器中使用最多的模型是 CART 决策树和神经网络。同质个体学习器按照个体学习器之间是否存在依赖关系可以分为两类，第一个是个体学习器之间存在强依赖关系，一系列个体学习器基本都需要串行生成，代表算法是 boosting 系列算法，比较著名的算法主要有 AdaBoost 算法和梯度提升树(GBDT)；第二个是个体学习器之间不存在强依赖关系，一系列个体学习器可以并行生成，代表算法是 bagging 和随机森林（Random Forest）系列算法。 boosting 与 bagging 的算法原理可以参考这篇文章。

1.2 集成学习的组合策略

1.2.1 平均法

对数值型输出 $G_i(x)$ 来说，最常见的结合策略是平均法，即输出 $K$ 个训练器的平均值。
1 简单平均法

$G(x)=\dfrac{1}{K}\sum_{i=1}^KG_i(x)$

2 加权平均法

$G(x)=\sum_{i=1}^Kw_iG_i(x)$
其中 $w_i$ 是个体学习器 $G_i(x)$ 的权重，通常有 $w_i \geq0,\sum_{i=1}^T{w_i}=1$

1.2.2 投票法

分类问题常用投票法的结合策略，假设预测类别为 ${c_1,c_2,...,c_K\}$ ，对于任意一个预测样本 $x$ ， $K$ 个弱分类器的预测结果为 ${G_1(x),G_2(x),...,G_K(x)\}$ 。
1 绝对多数投票法
常说的票数过半，即不止要求 $K$ 个弱分类器预测的类别票数最高，还要求票数过半。否则，拒绝预测。
2 相对多数投票法
少数服从多数原则，即选择 $K$ 个弱分类器预测的类别票数最高的预测类别，如果不止一个类别获得最高票，则随机选择一个做最终类别。
3 加权投票法
与加权平均法一样，每个弱学习器的分类票数要乘以一个权重，最终将各个类别的加权票数求和，最大的值对应的类别为最终类别。

1.2.3 学习法

当训练数据较多时，一种更为强大的结合策略是使用"学习法"，即通过另一个学习器来进行结合。其中比较著名的方法是 Stacking，即将训练集弱学习器的学习结果作为输入，将训练集的输出作为输出，重新训练一个学习器来得到最终结果，我们不是对弱学习器的结果做简单的逻辑处理，而是再加上一层学习器。在该方法下将弱学习器称为初级学习器，将用于结合的学习器称为次级学习器。