机器学习算法基础六提升 Adaboost

最新推荐文章于 2024-05-05 19:16:43 发布

不可描述的两脚兽

最新推荐文章于 2024-05-05 19:16:43 发布

阅读量276

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_22096121/article/details/104437087

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

什么是Adaboost?
AdaBoost算法: 通过迭代弱分类器而产生最终的强分类器的算法，可以理解为在弱分类器之上增加了权重配置，使误差率小的分类器拥有更高的权重。

文章目录

提升概念
提升算法
Adaboost

我们已经学习过决策树这种分类器，并且知道可以通过随机森林的方式完成样本加权、分类器加权，从而使得由弱分类器得到强分类器。Adaboost就是分类器加权的一种方式，即多个分类器的集成。

提升概念

在这里插入图片描述

提升算法

在这里插入图片描述

预测值： $F(x_i)$ ，实际值： $y_i$ ，二者差值就是一个残差
将所有残差累加：
$当L(F)=\frac{1}{m}\sum_{i=1}^m(F(x_i)-y_i)^2$
$\frac{\partial L}{\partial F}=\frac{2}{m}\sum_{1=i}^m(F(x_i)-y_i)$
实际的损失函数不见得是这个，所以称为伪残差

参照牛顿法（梯度下降法）可知，使用一阶导绕不过去的 $\gamma$ 学习率。

树	1	2	3	…	t-1
T	$T_1(x)$	$T_2(x)$	$T_3(x)$	…	$T_{t-1}(x)$
权值	$\alpha_1$	$\alpha_2$	$\alpha_3$	…	$\alpha_{t-1}$

计算第i个样本的预测值 $y_i$ ，输入样本 $x_i$ ：
$x_i \longrightarrow \alpha_1T_1(x_i)+\alpha_2T_2(x_i)+\alpha_3T_3(x_i)+...+\alpha_{t-1}T_{t-1}(x_i)=\hat{y}_i$

样本	预测值
$x^{(1)}$	$\hat{y}_{t-1}^{(1)}$
$x^{(2)}$	$\hat{y}_{t-1}^{(2)}$
$x^{(3)}$	$\hat{y}_{t-1}^{(3)}$
…	…
$x^{(m)}$	$\hat{y}_{t-1}^{(m)}$

在已知样本和预测值 $T(t-1),\hat{y}_{(t-1)}$ 的前提下，如何算 $T(x)和\alpha_t$ 。考虑使用二阶导信息。

在这里插入图片描述
$\frac{\partial J}{\partial f_t}=\sum_{i=1}^n(g_i+h_if_t(x_i))+\frac{\partial \Omega}{\partial f_t}$

在这里插入图片描述

Adaboost

在这里插入图片描述

$通常e_m < 0.5$ ， $e_m越小，\alpha_m越大。谁的误差率越小，谁的权值就越大。（e_m=0.5 \rightarrow \alpha_m=0）$

在这里插入图片描述

有了 $w_{m+1, i}$ ，就可以算 $G_{m+1}$ ，就可以算 $w_{m+2}$ …

在这里插入图片描述

举例

在这里插入图片描述

Adaboost误差上限

在这里插入图片描述

AdaBoost总结

在这里插入图片描述

不可描述的两脚兽

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法基础六提升 Adaboost

什么是Adaboost?AdaBoost算法: 通过迭代弱分类器而产生最终的强分类器的算法，可以理解为在弱分类器之上增加了权重配置，使误差率小的分类器拥有更高的权重。我们已经学习过决策树这种分类器，并且知道可以通过随机森林的方式完成样本加权、分类器加权，从而使得由弱分类器得到强分类器。Adaboost就是分类器加权的一种方式，即多个分类器的集成。提升概念提升算法预...
复制链接

扫一扫