AdaBoost算法详解

最新推荐文章于 2024-05-05 19:16:43 发布

oppeuro

最新推荐文章于 2024-05-05 19:16:43 发布

阅读量3k

点赞数

分类专栏：数据挖掘文章标签：数据挖掘 Adaboost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oppeuro/article/details/53768809

版权

数据挖掘专栏收录该内容

3 篇文章 0 订阅

订阅专栏

AdaBoost 算法介绍

AdaBoost算法本身是通过改变数据分布来实现的，它根据每次训练集之中每个样本的分类是否正确，以及上次的总体分类的准确率，来修改每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练，最后将每次得到的分类器最后融合起来，作为最后的决策分类器。

AdaBoost算法

训练数据集

技术分享

初始化训练数据的权值分布
对M＝1,2,…,m

使用具有权值分布Dm的训练数据集学习，得到基本分类器：

计算G_m(x)在训练数据集上的分类误差率：

更新训练数据集的权值分布：
Z_m是规范化因子：
计算G_m(x)的系数
构建基本分类器的线性组合

AdaBoost说明：

假设训练数据集具有均匀的权值分布，即每个训练样本在基本分类器的学习中作用相同，

这一假设保证第1步能够在原始数据上学习基本分类器G₁(x)
AdaBoost反复学习基本分类器，在每一轮m＝1,2,…,M顺次地执行下列操作：

1.使用当前分布Dm加权的训练数据集，学习基本分类器Gm(x)。

2.计算基本分类器G_m(x)在加权训练数据集上的分类误差率：

这里，w_mi表示第m轮中第i个实例的权值.

这表明，G_m(x)在加权的训练数据集上的分类误差率是被G_m(x)误分类样本的权值之和，

由此可以看出数据权值分布D_m与基本分类器G_m(x)的分类误差率的关系

3. 计算基本分类器G_m(x)的系数am。am表示G_m(x)在最终分类器中的重要性。

当e_m≤1/2时，a_m≥0，并且a_m随着e_m的减小而增大，

所以分类误差率越小的基本分类器在最终分类器中的作用越大。

4.更新训练数据的权值分布为下一轮作准备

技术分享

被基本分类器Gm(x)误分类样本的权值得以扩大，而被正确分类样本的权值却得以缩小

误分类样本在下一轮学习中起更大的作用。

不改变所给的训练数据，而不断改变训练数据权值的分布，使得训练数据在基本分类器的学习中起不同的作用

线性组合f(x)实现M个基本分类器的加权表决。

?

AdaBoost的例子

弱分类器由x<v或x>v产生, 其阈值v使该分类器在训练数据集上分类误差率最低.

技术分享

初始化数据权值分布

技术分享

对于m＝1

在权值分布为D₁的训练数据上，阈值v取2.5时分类误差率最低，故基本分类器为

技术分享

G₁(x)在训练数据集上的误差率e₁＝P(G₁(x_i)≠y_i)＝0.3。

计算G₁(x)的系数：

技术分享

更新训练数据的权值分布：

技术分享

分类器sign[f₁(x)]在训练数据集上有3个误分类点。

对于m= 2

在权值分布为D₂的训练数据上，阈值v是8.5时分类误差率最低，基本分类器为

技术分享

G₂(x)在训练数据集上的误差率e₂＝0.2143

计算a₂＝0.6496

更新训练数据权值分布:

技术分享

分类器sign[f₂(x)]在训练数据集上有3个误分类点。

对于m = 3：

在权值分布为D₃的训练数据上，阈值v是5.5时分类误差率最低，基本分类器为

技术分享

计算a₃＝0.7514

更新训练数据的权值分布

D₄＝(0.125,0.125,0.125,0.102,0.102,0.102,0.065,0.065,0.065,0.125)

得到：

技术分享

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
AdaBoost算法详解

AdaBoost算法训练数据集初始化训练数据的权值分布对M＝1,2,…,m使用具有权值分布Dm的训练数据集学习，得到基本分类器：计算Gm(x)在训练数据集上的分类误差率：计算Gm(x)的系数更新训练数据集的权值分布：Zm是规范化因子：构建基本分类器的线性组合AdaBoost说明：
复制链接

扫一扫

专栏目录

oppeuro CSDN认证博客专家 CSDN认证企业博客

码龄10年

3: 原创

60万+: 周排名

97万+: 总排名

1万+: 访问

: 等级

147: 积分

2: 粉丝

2: 获赞

2: 评论

12: 收藏

私信

关注

热门文章

分类专栏

数据挖掘 3篇

最新评论

PrefixSpan算法详解
五云山庄余欢水: 大佬，找到了吗 java代码实现
PrefixSpan算法详解
狄洺: 有没有实现的代码

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。