AdaBoost提升方法

沉住气CD

已于 2024-01-02 12:23:35 修改

阅读量1k

点赞数 22

分类专栏：机器学习常用算法文章标签：机器学习算法深度学习数据挖掘

于 2023-12-20 18:25:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pydarren/article/details/135114782

版权

机器学习常用算法专栏收录该内容

11 篇文章 3 订阅

订阅专栏

提升方法的基本思想是通过改变训练样本的权重学习多个分类器，并将这些线性分类器进行线性组合，提高分类性能。

AdaBoost

提高前一轮被分类错误样本的权值，降低前一轮被分类正确的权值；
加大分类误差率小的弱分类器的权值。

算法
输入：训练集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ，其中 $x_i\in X \subseteq R^n$ ， $y_i\in Y \subseteq\{-1,1\}$ ；弱学习算法。
输出：最终分类器 $G (n)$ 。

初始化训练数据的权值分布
$D_1=(w_{11},...,w_{1i},...,w_{1N}),w_1i=\frac{1}{N}$
对 $m = 1, 2, ..., M$
- 使用具有权值分布 $D_m$ 的训练集学习，得到基本分类器：
  $G_m(x):X\longrightarrow\{-1,1\}$
- 计算 $G_m(x)$ 在训练集上的分类误差率：
  $e_m=\sum_{i=1}^{N}P(G_m(x_i)\neq y_i)\\=\sum_{i=1}^{N}w_{mi}I(G_m(x_i)\neq y_i)\\=\sum_{G_m(x_i)\neq y_i}w_{mi}$
- 计算 $G_m(x)$ 的系数：
  $\alpha_{m}=\frac{1}{2}log\frac{1-e_m}{e_m}$
- 更新训练集的权值分布
  $D_{m+1}=(w_{m+1,1},...,w_{m+1,i},...,w_{m+1,N})$
  $w_{m+1,i}=\frac{w_{m,i}}{Z_m}exp(-\alpha_{m}y_{i}G_{m}(x_i)),{i=1,2,...,N} \qquad \qquad ①$
  其中 $Z_m$ 是规范化因子
  $Z_m=\sum_{i=1}^{N}w_{m,i}exp(-\alpha_{m}y_{i}G_{m}(x_i))$
  它使得 $D_{m+1}$ 成为一个概率分布，即 $\sum_{i=1}^{N}w_{m,i}=1$ 。
构建基本分类器的线性组合
$f(x)=\sum_{m+1}^{M}\alpha_{m}G_{m}(x)$
得到最终分类器
$G(x)=sign(f(x))=sign(\sum_{m=1}^{M}\alpha_{m}G_{m}(x))$
注：式①可写成
$w_{m+1,i}=\left\{\begin{aligned}\frac{w_{m,i}}{Z_m}e^{-\alpha_m},G_{m}(x_i)=y_i\\\frac{w_{m,i}}{Z_m}e^{\alpha_m},G_{m}(x_i)\neq y_i\\\end{aligned} \right.$
可知误分类样本在每一轮学习后权重会被放大 $e^{2\alpha_m}=\frac{1-e_m}{e_m}$ 倍，系数 $\alpha_m$ 表示分类器 $G_m(x)$ 的重要性，所有 $\alpha_m$ 之和并不等于1。

关注

22
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
AdaBoost提升方法

提升方法的基本思想是通过改变训练样本的权重学习多个分类器，并将这些线性分类器进行线性组合，提高分类性能。可知五分类样本在每一轮学习后权重会被放大。初始化训练数据的权值分布。构建基本分类器的线性组合。
复制链接

扫一扫

专栏目录

沉住气CD

CSDN认证博客专家 CSDN认证企业博客

码龄6年

110: 原创

7万+: 周排名

1万+: 总排名

17万+: 访问

: 等级

2753: 积分

503: 粉丝

634: 获赞

37: 评论

1173: 收藏

私信

关注

分类专栏

工程开发 2篇
数据可视化 5篇
PyTorch 5篇
机器学习常用算法 11篇
NLP 3篇
统计学 12篇
python学习 17篇
R学习 11篇
数据库 7篇
爬虫 3篇
数据结构 19篇
深度学习 5篇

最新评论

统计学之基础知识（数据分析准备）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
利用R语言进行基本数据管理
沉住气CD: 强推ggplot2
R语言高级数据管理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
利用R语言进行基本数据管理
CSDN-Ada助手: R语言中的数据可视化库有哪些？
利用R语言的dplyr包进行数据转换
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。