统计学习方法第八章提升方法

辰明Xucy

已于 2022-12-12 15:48:49 修改

阅读量155

点赞数 1

文章标签：学习方法算法

于 2022-12-12 15:47:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50650660/article/details/128288289

版权

文章目录

第八章提升方法

第八章提升方法

8.1 提升方法AdaBoost法

8.1.1 PAC学习框架

输入： $\mathcal{X}$

输出： $\mathcal{Y}$

概念类(类似于映射)：

$\mathcal{C}$ ：由所有想要学习的概念所组成的集合

$\mathcal{H}$ ：所有可能的概念类

观测： $\mathcal{T}$ ={ $x_1,y_1),...,(x_m,y_m)$ }

学习： $\mathcal{S}$ ={ $x_1,y_1),...,(x_m,y_m)$ }

泛化误差： $\mathcal{R}(h)=Pr_{\mathcal{X}\thicksim\mathcal{D}}[h(x)\neq c(x)]$ (错误率）

在这里插入图片描述

强可学习：PAC

我们可以借助弱可学习去构造强可学习。

提升方法的内核

弱学习器是什么样子
如何将弱学习器组合为强学习器

8.1.2 AdaBoost算法

在这里插入图片描述

1.假设训练集具有均匀的权值分布，在原始数据上学习第一个分类器 $G_1(x)$

2.AdaBoost反复学习学习器，在每一轮m=1,2,…,M 顺序的执行一下操作

（a）使用当前的加权训练数据集 $D_m$ ，学习分类器 $G_m(x)$

（b）计算分类器在加权训练数据集上的分类误差率
在这里插入图片描述

（c）计算分类器的系数 $\alpha_m$ ，其表示该分类器在最终分类器中的重要性。

（d）更新权值分布为下一轮做准备

误分类的样本的权值不断扩大，正确分类样本的权值不断缩小。

3.线性组合 $f (x)$ 实现 $M$ 个分类器的加权表决。

8.2 AdaBoost算法的训练误差分析

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

8.3 AdaBoost算法解释

逐步回归

逐步向前

$Y=\beta+\epsilon$ ------零模型 $f_0(x;\beta)$

$Y=\beta_0+\beta_1x^{(j)}+\epsilon f_1(x;\beta) $

$Y=\beta_0+\beta_1x^{{(2)}+\beta_1x}{(j)}+\epsilon f_2(x;\beta) $

以此类推
逐步先向后

$Y=\beta_0+\beta_1x^{{(2)}+\beta_1x}{(j)}+···+\beta_1x^{§}+\epsilon f_p(x;\beta) $

逐步剔除变量

可加模型

在这里插入图片描述

8.3.1 前向分布算法

8.3.2 前向分步算法和AdaBoost

在这里插入图片描述

8.4 提升树

8.4.1 提升树模型

在这里插入图片描述

8.4.2 提升树算法

在这里插入图片描述

8.4.3 梯度提升方法

在这里插入图片描述

利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值，

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。