统计学习方法-第八章

最新推荐文章于 2021-08-03 02:50:06 发布

那年柒月人未眠

最新推荐文章于 2021-08-03 02:50:06 发布

阅读量250

点赞数

分类专栏：统计学习方法文章标签：统计学习方法

本文链接：https://blog.csdn.net/U201410691/article/details/88636036

版权

统计学习方法专栏收录该内容

13 篇文章 0 订阅

订阅专栏

统计学习第八章-提升方法

提升方法

提升方法

AdaBoost

算法如下：
(1)假设每个数据具有相同的权值，训练出基分类器 $G_1(x)$ ,
(2.1)使用当前加权Dm，进行基分类器的学习 $G_m(x)$ 。
(2.2)计算误差率，即分类结果与实际结果不相同
$e_m = \sum_{i=1}^NP(G_m(x_i)\neq y_i) = \sum_{G_m(x_i)\neq y_i} w_{mi}$
其中 $w_{mi}$ 表示每个数据的权值， $\sum w_{mi}=1$ 。
(2.3)计算更新率 $α_m$ ， $e_m$ 约大则 $α_m$ 越小，说明占的比重越小
$α_m = \frac{1}{2}log\frac{1-e_m}{e_m}$
(2.4)更新权值
$w_{m+1,i} = \left\{\begin{array}{cc} \frac{W_mi}{Z_m}e^{-α_m}, & G_m(x)=y_i\\ \frac{W_mi}{Z_m}e^{α_m},, & G_m(x)\neq y_i \end{array}\right.$
其中Zm使规范化因子
$Z_m = \sum_{i=1}^Nw_{mi}exp(-α_my_iG_m(x_i))$
(3)得到最终分类器，
$sign(\sum_{m=1}^Mα_mG_m(x_i))$

向前分布算法

该算法的主要思想为优化损失函数，加法模型如下：
$\sum_{m=1}^Mβ_mb(x,\gamma_m)$
其中， $β_m$ 与AdaBoost算法中的 $α_m$ 类似，为每步新加的东西的权重， $b(x,\gamma_m)$ ，则是与AdaBoost算法中的分类器类似，是一个加法器所加的东西。我们的目的就是优化损失函数:
$min_{β,\gamma} = \sum_{i=1}^NL( y_i,\sum_{m=1}^Mβ_mb(x_i,\gamma_m))$
由于该函数模型的自由度太高，采用贪心算法，只优化每一步的最优值则得到最终的最优值得到优化结果，采用加法进行迭代
$min_{β,\gamma} = \sum_{i=1}^NL( y_i,βb(x_i,\gamma))$
算法如下：
已知：训练集T，损失函数L，基函数 $b(x,\gamma_m)$
(1)初始化模型 $f_0(x) = 0$
(2.1)对m = 1，2，…，N
优化损失函数：
$min_{β,\gamma} = \sum_{i=1}^NL( y_i,f_{m-1}(x_i)+βb(x_i,\gamma))$
对式子求偏导通常可解出答案。得到 $β,\gamma$
(2.2)更新 $f_{m}(x) =f_{m-1}(x_i)+βb(x_i,\gamma)$
(3)得到加法模型
$\sum_{m=1}^Mβ_mb(x,\gamma_m)$
AdaBoost算法是向前分布算法的一个特例。

提升树模型

已知：训练集T，损失函数L，基函数 $T(x,Θ_m)$
初始化
$argmin\sum_{m=1}^NL(y_i,c)$
对这个进行计算，
$r_{mi} = -[\frac{\partial L(y_i,f(x_i))}{\partial f(x_i)}]$
对 $r_{mi}$ 拟合一个回归树，得到节点区域，对节点区域 $R_{mj}$
$c_{mj} = argmin\sum_{x_i∈R_{mi}}^NL( y_i,f_{m-1}(x_i)+c)$
更新 $f_m(x)=f_{m-1}(x)+\sum_{j=1}^Jc_{mj}I(x∈R_{mj})$
继续拟合，得到回归树。

那年柒月人未眠

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法-第八章

统计学习第八章-提升方法提升方法AdaBoost向前分布算法提升树模型提升方法AdaBoost算法如下：(1)假设每个数据具有相同的权值，训练出基分类器G1(x)G_1(x)G1(x),(2.1)使用当前加权Dm，进行基分类器的学习Gm(x)G_m(x)Gm(x)。(2.2)计算误差率，即分类结果与实际结果不相同em=∑i=1NP(Gm(xi)≠yi)=∑Gm(xi)≠yiwmi...
复制链接

扫一扫