机器学习(周志华)学习笔记八:集成学习(上)

本文记录集成学习AdaBoost算法的学习体会,并编写习题8.3程序。
摘要由CSDN通过智能技术生成

一、AdaBoost思想

“三个臭皮匠,顶个诸葛亮”,这也正是集成学习的目的。为了达到上述目的,AdaBoost算法有两个核心思想。
1、更加关注之前基学习器做错的样本;
2、降低错误率较高的基学习器的权重,提高错误率低的基学习器权重。

举个例子,有若干名同学先后做同一套考试卷。考完的同学会告诉后面的同学自己哪道题做错了,让后面的同学更加关注这些错题,以便提高后面同学的正确率。
之后,当面对一道新的题目时,我们会参考所有同学的答案,并更倾向于相信考试时正确率较高的同学。

二、AdaBoost算法

对于上述两个核心思想,AdaBoost均有计算公式。
首先,为了更加关注之前基学习器做错的样本,在每轮学习过程中均会更新样本权重,更新公式如下:
样本权重更新公式
其中,αt是基学习器权重,后文将会介绍。f(x)是样本实际分类值,ht(x)是基学习器分类输出值。Zt为归一化因子。

此后,为了降低高错误率学习器的权重,提高低错误率学习器的权重,每轮需要更新基学习器的权重αt,更新公式如下:
基学习器权重更新公式
其中,ϵt为样本分类错误率。需要说明的是,样本分类错误率需要基于样本权重进行计算。 不能只是对错误样本进行计数,之后除以总数。

三、习题8.3运行结果

1、基学习器数量为3时:

基学习器数量: 3
实际样本类别值:
 [ 1  1  1  1  1  1  1  1 -1 -1 -1 -1 -1 -1 -1 -1 -1]
学习器分类值:
 [ 1.  1.  1.  1.  1.  1.  1.  1. -1. -1. -1. -1.  1.  1. -
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

萌哒哒虎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值