【笔记】《统计学习方法》(8)提升方法

最新推荐文章于 2022-01-19 10:59:44 发布

煎饼证

最新推荐文章于 2022-01-19 10:59:44 发布

阅读量292

点赞数

分类专栏：机器学习读书笔记

本文链接：https://blog.csdn.net/jianbinzheng/article/details/79509062

版权

机器学习同时被 2 个专栏收录

32 篇文章 0 订阅

订阅专栏

读书笔记

24 篇文章 4 订阅

订阅专栏

简书：https://www.jianshu.com/p/eb9d50312de8

第8章提升方法

强可学习与弱可学习式等价的，在概率近似正确(probably approximately correct, PAC)学习的框架下
提升(boosting)要解决的两个问题：
(1)每一轮如何改变训练数据的权值和概率分布
(2)弱分类器如何组合成一个强分类起
AdaBoost的做法
(1)提高被前一轮弱分类器错误分类样本的权值，而降低哪些被正确分类样本的权值
(2)弱分类器的组合，采用加权多数表决的方法
4.AdaBoost算法(略)P138
AdaBoost的两个特点：
(1)不改变所给的训练数据，而不断改变训练数据权值的分布，使得训练数据在基本分类器的学习中起不同的作用
(2)利用基本分类器的线性组合构建最终的分类器
AdaBoost的训练误差分析P142
AdaBoost算法的另一种解释：模型为加法模型、损失函数为指数函数、学习算法为前向分布算法时的二分类学习方法
前向分布算法P144
提升树是以分类树或回归树为基本分类器的提升方法
$f M (x) = \sum m = 1 M T (x; Θ m)$ $f_M(x)=\sum_{m=1}^M T(x;\Theta_m)$
提升树算法
$f m (x) = f m - 1 (x) + T (x; Θ m) Θ^m = arg min Θ m \sum I = 1 N L (y i, f m - 1 (x i) + T (x i; Θ m))$ $f_m(x)=f_{m-1}(x)+T(x;\Theta_m)\\ \hat{\Theta}_m=\arg \min_{\Theta_m} \sum_{I=1}^N L(y_i,f_{m-1}(x_i)+T(x_i;\Theta_m))$
提升树利用加法模型和前向分步算法实现学习的优化过程，当损失函数是平方损失误差时，每一步优化时很简单的。但是对于一般的损失函数而言比较复杂。Freidman提出了梯度提升(gradient boosting)算法，利用最速下降法的近似方法，关键是利用损失函数的负梯度在当前模型的值作为回归问题提升树算法的近似值你和回归树
$- [\partial L ( y , f ( x i ) ) \partial f ( x i )] f (x) = f m - 1 (x)$ $-[\frac{\partial L(y,f(x_i))}{\partial f(x_i)}]_{f(x)=f_{m-1}(x)}$
梯度提升算法P151

煎饼证

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【笔记】《统计学习方法》(8)提升方法

简书：https://www.jianshu.com/p/eb9d50312de8第8章提升方法强可学习与弱可学习式等价的，在概率近似正确(probably approximately correct, PAC)学习的框架下提升(boosting)要解决的两个问题： (1)每一轮如何改变训练数据的权值和概率分布 (2)弱分类器如何组合成一个强分类起AdaBoost的...
复制链接

扫一扫