AdaBoost算法

最新推荐文章于 2024-03-17 20:24:20 发布

XGBoost

最新推荐文章于 2024-03-17 20:24:20 发布

阅读量732

点赞数 1

分类专栏：机器学习文章标签：提升机器学习算法函数统计学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012771351/article/details/53000694

版权

机器学习专栏收录该内容

35 篇文章 4 订阅

订阅专栏

注：本文中所有公式和思路来自于李航博士的《统计学习方法》一书，我只是为了加深记忆和理解写的本文。

开场直接套用《统计学习方法》中的一段话：

提升方法有两个问题需要回答：一是在每一轮的学习中如何改变样本的权值，二是如何将弱分类器组合成一个强分类器。第一个问题我的理解就是每一轮学习之后，对于误分的样本在下一轮学习中给予更高的权重，更加关注。第二个问题的答案是对于分类误差小的分类器给予更高的权值，使其在表决中的作用更大，分类误差大的分类器给予更小的权值。就是这么的简单思想，但那时请务必注意这两个问题，一个是针对每一个样本的权值，一个是针对每一个分类器的权值，不要混淆。

算法描述：

输入：训练数据集：

其中，

；弱学习算法。

输出：最终分类器G(x).

(1):初始化样本的权值分布：

(2):对于m=1,2,3...M

(a):使用具有权重分布Dm的训练数据集合学习，得到基本分类器：

(b):计算G(x)在训练数据集合上的误差率：

(c):计算G(x)的系数：

(d)：更新训练数据权重分布：

其中Z为归一化因子，可以是Dm成为一个加和为1的概率分布：

(3):构建分类器的线性组合：

得到在最终的分类器：

对AdaBoost算法的解释如下：

步骤(1): 假设训练数据集初始权重相同，学习得到G1(x)

步骤(2): AdaBoost反复学习基本分类器，从m=1,2...M中的每一轮顺序的执行下列操作：

(a): 使用当前的分布Dm加权的训练数据集，学习基本分类器Gm(x)

(b): 计算Gm(x)在加权的训练集上的错误率：

Wmi是值第m轮中第i个样本的权值，所有权值加起来为1，因此Gm在加权训练数据集上的分类错误率等于被分类器Gm误分的样本权值之和。

(c): 计算基本分类器Gm的系数αm，αm表示Gm在最终分类器中的重要程度，可以根据公式得出，当αm≤0.5，αm≥0，并且αm随着em的减少而增大，所以分类误差越小的分类器在表决中起到的着用越大。

(d): 更新训练数据集的权值分布，为下一轮准备：

从这个公式中不难看出，如果分类错误，样本的权值就会加大。

步骤(3): 线性组合f(x)实现M个基本分类器的加权表决，其中αm为基本分类器在表决中起到的重要性，并且αm的加和不为1，这就意味着正例可能会正很多，负例可能会负很多，使得分类器的确信度更好。

到此，AdaBoost算法就介绍完了，推荐学者参考《统计学习方法》中的案例加深理解。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
AdaBoost算法

注：本文中所有公式和思路来自于李航博士的《统计学习方法》一书，我只是为了加深记忆和理解写的本文。开场直接套用《统计学习方法》中的一段话：提升方法有两个问题需要回答：一是在每一轮的学习中如何改变样本的权值，二是如何将弱分类器组合成一个强分类器。第一个问题我的理解就是每一轮学习之后，对于误分的样本在下一轮学习中给予更高的权重，更加关注。第二个问题的答案是对于分类误差小的分类器给予更高的权值，使
复制链接

扫一扫

专栏目录

博客等级

码龄10年

34
原创

67
点赞

116
收藏

64
粉丝

关注

私信

热门文章

分类专栏

机器学习 35篇
linux 2篇
deep learning 1篇

最新评论

HMM之前向后向算法
weixin_46083434: 你好，非常感谢你的讲解让我可以把前向算法和后向算法结合起来理解，不过还有两个问题不是很明白，1. 单个状态的概率那个公式，分母P(o|lamda) 换成alphat(i)*betat(i)再对所有i（状态）求和，是因为生成观测序列o的总概率是t时刻下每个i（状态）可能的概率之和吗？ 2. 最后那个联合概率转换到最终结果不太明白，请问可以请教一下再具体一点的步骤吗？谢谢
LDA-隐狄利克雷分布-主题模型
leilei9406: 想请问下如果做短文拼接可以有哪些方法，我正在做一个短文本的LDA结果不是很好，可以请教下您吗？
变分算法
qq_36711371: 请问一下，P（x）和q（x）的距离公式中，α=1的时候，公式为什么会退化为KL(p||q)，α=1时，分母为0.
HMM之前向后向算法
Chester_ieee: 前后向概率的公式，i和t好像是写反了。
聚类之层次聚类与密度聚类
落入凡间的奥特曼: 你好，请问这个机器学习升级版是课程吗?

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。