机器学习基础（五）：计算学习理论（PAC学习、有限假设空间、VC维、Rademacher复杂度、稳定性）

最新推荐文章于 2024-03-07 16:13:17 发布

ling零零零

最新推荐文章于 2024-03-07 16:13:17 发布

阅读量2.2k

点赞数 2

分类专栏：机器学习文章标签：概率论机器学习算法

本文链接：https://blog.csdn.net/weixin_44949421/article/details/120499416

版权

机器学习专栏收录该内容

16 篇文章 17 订阅

订阅专栏

5、计算学习理论

计算学习理论computational learning theory：研究关于机器学习的基础理论
在这里插入图片描述
几个常用不等式：

5.1 PAC学习

概率近似正确（PAC）Probably Approximately Correct：最基本的计算学习理论
——以较大的概率学得误差满足预设上限的模型，PAC 学习给出了一个抽象地刻画机器学习能力的框架
在这里插入图片描述

若目标概念c∈H，则H中存在假设能将所有示例按与真实标记一致的方式完全分开，称该问题对学习算法是可分的separable/一致的consistent；
若c∉H，则H中不存在任何假设能将所有示例完全正确分开，称不可分的non-separable/不一致的non-consistent

|H|有限时，称假设空间H为有限假设空间，否则称无限假设空间

5.2有限假设空间

5.2.1可分情形（c∈H）

给定包含m个样例的训练集D，如何找出满足误差参数的假设？

→D中样例标记都是由目标概念c赋予的，且c存在于H中，则只需保留与D一致的假设，剔除与D不一致的假设即可（训练集规模有限时无法区分等效假设）

需多少样例才能学得目标概念c的有效近似？
→保证泛化误差大于在这里插入图片描述，且在训练集上表现完美的所有假设出现概率之和不大于即可：

5.2.2不可分情形（c∉H）

假定对于任何h∈H，在这里插入图片描述，也就是H中任意一个假设都会在训练集上出现或多或少的错误

→在H的所有假设中找出最好的一个

H中泛化误差最小的假设是在这里插入图片描述，于是可将PAC学习推广到c∉H的情况，称“不可知学习agnostic learning”：

5.3 刻画假设空间复杂度的途径

5.3.1 VC维（Vapnik-Chervonenkis dimension）

考虑假设空间的VC维：度量假设空间的复杂度
增长函数growth function：假设空间H对m个示例所能赋予标记的最大可能结果数。（结果数越大，H的表示能力越强，适应能力也越强）
在这里插入图片描述
→利用增长函数估计经验误差与泛化误差之间的关系：

对二分类问题来说，H中的假设对D中示例赋予标记的每种可能结果称为D的一种"对分dichotomy"；若假设空间H能实现示例集D上的所有对分，即，则称示例集D能被假设空间H"打散shattering"
假设空间H的VC维是能被H打散的最大示例集的大小：
在这里插入图片描述
VC(H)=d表明存在大小为d的示例集能被假设空间H打散
VC维的定义与数据分布无关

→VC维与增长函数的联系：在这里插入图片描述
→基于VC维的泛化误差界：

（只与样例数目m有关，收敛速率为O(1/√m)，分布无关distribution-free，数据独立data-independent）

→任何VC维有限的假设空间H都是(不可知)PAC可学习的

5.3.2 Rademacher复杂度

与VC维不同的是，Rademacher复杂度在一定程度上考虑了数据分布
在这里插入图片描述
→Rademacher复杂度与增长函数联系：

→基于Rademacher复杂度的关于函数空间F的泛化误差界：

5.3.3稳定性stability

获得与算法有关的分析结果：算法在输入发生变化时，输出是否会随之发生较大的变化
在这里插入图片描述
损失函数：
刻画假设的预测标记与真实标记之间的差别，简记为
——泛化损失：
经验损失：
留一损失：

5.3.3.1算法的均匀稳定性uniform stability：

在这里插入图片描述

5.3.3.2基于稳定性分析推导出的算法的泛化误差界：

在这里插入图片描述
经验损失与泛化损失之间差别的收敛率为β√m，若β=O（1/m），则可保证收敛率为O(1/√m)，与基于VC维和Rademacher复杂度得到的收敛率一致

→稳定性分析不必考虑假设空间中所有可能的假设，只需根据算法自身的特性(稳定性)来讨论输出假设的泛化误差界

5.3.3.3经验风险最小化ERM（Empirical Risk Minimization）：

在这里插入图片描述
→若学习算法是ERM且稳定的，则假设空间H可学习

未完待续，喜欢的朋友可以关注后续文章~

机器学习基础系列文章回顾：
机器学习基础（一）：简介
 机器学习基础（二）：模型评估与选择
 机器学习基础（三）：决策树
 机器学习基础（四）：特征选择与稀疏学习

参考书目：
周志华.《机器学习》

ling零零零

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础（五）：计算学习理论（PAC学习、有限假设空间、VC维、Rademacher复杂度、稳定性）

5、计算学习理论计算学习理论computational learning theory：研究关于机器学习的基础理论几个常用不等式：5.1 PAC学习概率近似正确（PAC）Probably Approximately Correct：最基本的计算学习理论——以较大的概率学得误差满足预设上限的模型，PAC 学习给出了一个抽象地刻画机器学习能力的框架若目标概念c∈H，则H中存在假设能将所有示例按与真实标记一致的方式完全分开，称该问题对学习算法是可分的separable/一致的consisten
复制链接

扫一扫