数据挖掘十大经典算法学习之Adaboost自适应增强学习算法

Adaboost是一种迭代算法,通过结合多个弱分类器形成强分类器。它调整样本权重,使得弱分类器在错误分类的样本上更关注。在每次迭代中,错误分类的样本权重增加,正确分类的样本权重降低。最终,所有弱分类器按权重叠加生成强分类器。本文提供了一个二维空间数据集的示例,展示了Adaboost如何逐步调整权重和构建分类器。
摘要由CSDN通过智能技术生成

定义

The strong and weak learnability are equivalent.

--Kearns and Valiant(1989)

强分类器和弱分类器是相同的,多个弱分类器组合可以达到强分类器的效果。通过迭代生成一列分类器,每个分类器都依赖于之前的一个,之前分类器错分的样本被赋予更高的权重。

训练数据集D {(x1,y1,w1),( x2,y2,w2),…,( xn,yn,wn)}xi是输入向量,yi是它的类别并且yiY(类别集合),wi是样例的权重并且∑Iwi=1

算法构造kBaseLearner。每个训练样例的权重均被初始化为1/m。每次迭代中,数据集DtD相同,仅权重不同。每次迭代构造一个新的分类器ht

算法

AdaBoost算法的具体步骤如下:

1. 初始化样本权重为1/m,即为训练样本的初始权重分布;

3. 第一次迭代:

(1)训练样本的概率分布相当,训练弱分类器;

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值