机器学习之Adaboost算法

最新推荐文章于 2023-12-12 23:23:44 发布

Zhang Hongbo2019

最新推荐文章于 2023-12-12 23:23:44 发布

阅读量250

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_40238600/article/details/94771001

版权

本文深入介绍了Adaboost算法的基本思想和流程，通过实战分析展示了如何基于单层决策树构建弱分类器，并逐步形成强分类器。内容涵盖了Adaboost在马疝病数据集上的应用以及解决非均衡分类问题的讨论，提供了丰富的代码实现和实验结果。

摘要由CSDN通过智能技术生成

文章目录

一、算法原理

1.算法的基本思想

Adaboost是adaptive boosting的简写，是自适应的boosting算法，基本思想为：在前一个弱分类器的基础上，增加误分类样本的权重，这些误分类的样本在下一个弱分类器那里被重点关注，依次迭代进行，直到到达预定的足够小的错误率或最大的迭代次数为止。大概流程描述如下：

初始化训练数据的权值分布，假设样本个数为 $N$ ，则每个样本的权值为 $\frac{1}{N}$ ；
在初始训练集上训练出一个弱分类器，根据分类结果，被误分类的样本权重增加，正确分类的样本的权重将减少，然后将权值更新过的训练数据集用于训练下一个弱分类器，不断进行迭代。
将各个弱分类器进行组合形成强分类器。各个弱分类器也有自己的权重，加大分类误差率小的弱分类器的权重，使其在最终的分类函数中有更大的决定权，同理，减少分类误差率高的弱分类器的权重，使其在最终的分类函数中起着较小的决定权。

2.算法的流程

假设一个二分类的训练数据集 $T=\{(x_{\scriptscriptstyle 1},y_{\scriptscriptstyle 1}),(x_{\scriptscriptstyle 2},y_{\scriptscriptstyle 2}),\cdots,(x_{\scriptscriptstyle N},y_{\scriptscriptstyle N})\}$
其中， $x_{i}\in \chi \in R^{\scriptscriptstyle n}$ ，标记 $y_{\scriptscriptstyle i}\in \{-1,1\}$ 。
(1)初始化训练数据集的权值分布
$D_{\scriptscriptstyle 1}=(w_{\scriptscriptstyle 11},\cdots,w_{\scriptscriptstyle 1i},\cdots,w_{\scriptscriptstyle 1N}),\ w_{\scriptscriptstyle 1i}=\frac{1}{N},\ i=1,2,\cdots,N$
(2)训练每个弱分类器，假设有 $M$ 个弱分类器，对于 $m=1,2,\cdots,M$
(a)使用具有权值分布的训练数据集学习，得到基本分类器
$G_{\scriptscriptstyle m}(x)：\chi\to\{-1,1\}$

最低0.47元/天解锁文章

Zhang Hongbo2019

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习之Adaboost算法

文章目录一、算法原理1.算法的基本思想2.算法的流程二、实战分析一、算法原理1.算法的基本思想Adaboost是adaptive boosting的简写，是自适应的boosting算法，基本思想为：在前一个弱分类器的基础上，增加误分类样本的权重，这些误分类的样本在下一个弱分类器那里被重点关注，依次迭代进行，直到到达预定的足够小的错误率或最大的迭代次数为止。大概流程描述如下：初始化训练数据...
复制链接

扫一扫

专栏目录