AdaBoost

AdaBoost
  1. 初始化训练数据权重相等,假如有N个样本,每个样本被赋予相同的权值1/N,这时样本的权值分布为D1:
  2. 选择一个误差率最小的弱分类器作为个基分类器
  3. 计算基分类器的错误率
  4. 根据基分类器的错误率计算基分类器的投票权重
  5. 更新样本权重分布得到新的权重D2
  6. 循环执行2到5步m次
  7. 对m个学习器进行加权投票,获取最终分类器

举例如下:
数据集共有10条数据,根据x的输入得到的y可以分类两类,即y=1与y=-1。我们每一轮使用最简单的决策树来构造基分类器,也就是每轮设定一个阈值θ,只要x<θx<θ,就判定为正类(y=1),x>θx>θ就判定为负类(y=-1)。

x0123456789
y111-1-1-1111-1
  • 第一步: 初始化训练数据权重相等
    D1=(0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1,0.1)
  • 第二步: 选择一个误差率最小的弱分类器作为第一个基分类器
    取θ为0.5,1.5,2.5,…,8.5来对x进行分类,有两种分类方法:
    x<θ时分为正类,x>θ时分为负类,分类错误率对应 ϵt1
    x>θ时分为正类,x<θ时分为负类,分类错误率对应ϵt2 经过计算得:
错误率0.51.52.53.54.55.56.57.58.5
ϵt10.50.40.30.50.50.60.50.40.3
ϵt20.50.60.70.60.50.40.50.60.7

最终要选择一个令 ϵt1 ϵt2取得最小值的θ与分类方法

在权值分布为D1的训练数据上,从上述计算可知阈值v取2.5时分类误差率最低,故基本分类器为:
在这里插入图片描述

  • 第三步 :计算基分类器的错误率
    该学习器在训练数据中的错误率ϵt=0.3

  • 第四步 :根据基分类器的错误率计算基分类器的投票权重
    计算公式为:
    在这里插入图片描述
    计算结果为α1=​​0.4236

  • 第五步 :更新样本权重分布得到新的权重D2
    计算公式为:
    在这里插入图片描述

    Zt为归一化系数,将权重缩放到0到1 之间
    经计算得:
    D2=(0.07143,0.07143,0.07143,0.07143,0.07143,0.07143,0.16667,0.16667,0.16667,0.07143)

  • 第六步 :循环执行2到5步

    第二轮计算的:
    α2=​​0.6496
    D3=(0.0455,0.0455,0.0455,0.1667,0.1667,0.1667,0.1060,0.1060,0.1060,0.0455)
    H2(x)=sign[0.4236h1(x)+0.6496h2)

    第三轮计算的:
    α3=​​0.7514
    D4​​ =(0.125,0.125,0.125,0.102,0.102,0.102,0.065,0.065,0.065,0.125)

    H3(x)=sign[0.4236h1(x)+0.6496h2+0.7514h3(x))

第七步: 对m个学习器进行加权投票,获取最终分类器
H3(x)=sign[0.4236h1(x)+0.6496h2(x)+0.7514h3(x))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值