统计学习方法笔记：第八章.提升方法

最新推荐文章于 2022-02-10 22:07:08 发布

小滔滔ahh

最新推荐文章于 2022-02-10 22:07:08 发布

阅读量155

点赞数

分类专栏：统计学习

本文链接：https://blog.csdn.net/weixin_44692791/article/details/102631232

版权

18 篇文章 0 订阅

订阅专栏

第八章：提升方法

提升方法是将弱学习方法提升为强学习方法的统计学习方法；在分类问题中，提升方法通过反复修改训练数据的权值分布（对比之前的一些算法，基本上都认为所有训练数据的概率分布是一致的），构建一系列基本分类器弱分类器，然后将这些分类器线性组合，即得到强分类器；

Adaboost算法：模型为‘加法模型’；损失函数（策略）为‘指数函数’；学习方法为前向分步算法时的二类学习方法；

而提升树算法则是基函数为决策树的提升方法；

Adaboost算法的最基本的性质是它能在学习的过程中不断减少训练误差，即在训练数据上的分类误差率：

$\frac{1}{N}\displaystyle\sum_{i=1}^NI(G(x_i)\neq{y_i})\leq{\frac{1}{N}\sum_{i=1}^Nexp(-y_if(x_i))=\prod_mZ_m}$

$Z_m=\displaystyle\sum_{i=1}^Nw_{mi}exp(-\alpha_my_iG_m(x_i))$ 为规范化因子

特别地，在二类分类问题中：

$Z_m\leq{exp(-2\displaystyle\sum_{m=1}^{M}\gamma_m^2}),\gamma_m=\frac{1}{2}-e_m;$

上式表面，Adaboost算法的分类误差率是以 $\color{red}{指数速率}$ 下降的；

前项分步算法是一种求解 $\color{red}{加法模型}$ 参数（基函数的参数和系数）的最优化方法：

基本思想：
因为学习的是加法模型，如果能够从前向后，每一步只学习一个基函数及其系数，逐步逼近优化目标函数式（ $\color{red}{每次使一个基函数的损失函数值最小}$ ）:

$(\beta_m,\gamma_m)=arg\displaystyle\min_{\beta,\gamma}\sum_{i=1}^NL(y_i,\beta(x_i,\gamma));$

$f(x)=\displaystyle\sum_{m=1}^M\beta_mb(x;\gamma_m);$

提升树算法就是以 $\color{red}{分类树或回归树为基本分类器}$ 的提升方法。

分类问题只需把相应的基本分类器改成决策树就行了，下面给出回归 $\color{red}{某一段区间内对输出 Y 的预测，区别于对样本的分类（y=0或1）}$ 提升树的算法：

初始化 $f_0(x)=0$ ;
对于 m = 1,2,…M：
- 树可以表示为： $T(x;\Theta)=\displaystyle\sum_{j=1}^Jc_jI(x\in{R_j})，R_j$ 是被分的某一个输入空间， $c_j$ 是该子集的固定输出（由属于该子集的 $\color{red}{训练数据输出y的均值}$ 得来，具体可参见第五章回归树模型）
- 计算残差： $r_{mi}=y_i-f_{m-1}(x_i),i=1,2,...,N$
- 拟合残差（平方误差）学习一个回归树，得到 $T(x;\Theta_m)$ （m=0的时候，即拟合原始的输出值得到树 $T(x,\Theta_1$ ）
- 更新 $f_m(x)=f_{m-1}(x)+T(x;\Theta_m)$
得到回归问题提升树：
$f_M(x)=\displaystyle\sum_{m=1}^MT(x;\Theta_m)$

梯度提升是针对那些优化损失函数不是那么容易的问题（不太好计算，平方误差损失函数就很好计算）， $\color{red}{用损失函数在当前模型的负梯度作为回归问题提升树算法中残差的近似值}$

$r_{mi}=-[L(y_i,f(x_i)]'_{f(x_i)},f(x_i)=f_{m-1}(x)$

关注