机器学习基础(五):计算学习理论(PAC学习、有限假设空间、VC维、Rademacher复杂度、稳定性)

5、计算学习理论

计算学习理论computational learning theory:研究关于机器学习的基础理论
在这里插入图片描述
几个常用不等式
在这里插入图片描述

5.1 PAC学习

概率近似正确PAC)Probably Approximately Correct:最基本的计算学习理论
——以较大的概率学得误差满足预设上限的模型,PAC 学习给出了一个抽象地刻画机器学习能力的框架
在这里插入图片描述
在这里插入图片描述
目标概念c∈H,则H中存在假设能将所有示例按与真实标记一致的方式完全分开,称该问题对学习算法是可分的separable/一致的consistent;
c∉H,则H中不存在任何假设能将所有示例完全正确分开,称不可分的non-separable/不一致的non-consistent

|H|有限时,称假设空间H为有限假设空间,否则称无限假设空间

5.2有限假设空间

5.2.1可分情形(c∈H)

给定包含m个样例的训练集D,如何找出满足误差参数的假设

→D中样例标记都是由目标概念c赋予的,且c存在于H中,则只需保留与D一致的假设,剔除与D不一致的假设即可(训练集规模有限时无法区分等效假设)

需多少样例才能学得目标概念c的有效近似
→保证泛化误差大于在这里插入图片描述,且在训练集上表现完美的所有假设出现概率之和不大于在这里插入图片描述即可:
在这里插入图片描述

5.2.2不可分情形(c∉H)

假定对于任何h∈H,在这里插入图片描述,也就是H中任意一个假设都会在训练集上出现或多或少的错误
在这里插入图片描述
在H的所有假设中找出最好的一个

H中泛化误差最小的假设是在这里插入图片描述,于是可将PAC学习推广到c∉H的情况,称“不可知学习agnostic learning”:
在这里插入图片描述

5.3 刻画假设空间复杂度的途径

5.3.1 VC维(Vapnik-Chervonenkis dimension)

考虑假设空间的VC维:度量假设空间的复杂度
增长函数growth function:假设空间H对m个示例所能赋予标记的最大可能结果数。(结果数越大,H的表示能力越强,适应能力也越强)
在这里插入图片描述
→利用增长函数估计经验误差与泛化误差之间的关系:
在这里插入图片描述
对二分类问题来说,H中的假设对D中示例赋予标记的每种可能结果称为D的一种"对分dichotomy";若假设空间H能实现示例集D上的所有对分,即,则称示例集D能被假设空间H"打散shattering"
假设空间H的VC维是能被H打散的最大示例集的大小
在这里插入图片描述
VC(H)=d表明存在大小为d的示例集能被假设空间H打散
VC维的定义与数据分布在这里插入图片描述无关

VC维与增长函数的联系:在这里插入图片描述
基于VC维的泛化误差界
在这里插入图片描述
(只与样例数目m有关,收敛速率为O(1/√m),分布无关distribution-free,数据独立data-independent)

任何VC维有限的假设空间H都是(不可知)PAC可学习的

5.3.2 Rademacher复杂度

与VC维不同的是,Rademacher复杂度在一定程度上考虑了数据分布
在这里插入图片描述
Rademacher复杂度与增长函数联系:
在这里插入图片描述
→基于Rademacher复杂度的关于函数空间F的泛化误差界
在这里插入图片描述

5.3.3稳定性stability

获得与算法有关的分析结果:算法在输入发生变化时,输出是否会随之发生较大的变化
在这里插入图片描述
损失函数在这里插入图片描述
刻画假设在这里插入图片描述的预测标记在这里插入图片描述与真实标记在这里插入图片描述之间的差别,简记为在这里插入图片描述
——泛化损失:在这里插入图片描述
经验损失:在这里插入图片描述
留一损失:在这里插入图片描述

5.3.3.1算法的均匀稳定性uniform stability:

在这里插入图片描述

5.3.3.2基于稳定性分析推导出的算法的泛化误差界:

在这里插入图片描述
经验损失与泛化损失之间差别的收敛率为β√m,若β=O(1/m),则可保证收敛率为O(1/√m),与基于VC维和Rademacher复杂度得到的收敛率一致

→稳定性分析不必考虑假设空间中所有可能的假设,只需根据算法自身的特性(稳定性)来讨论输出假设的泛化误差界

5.3.3.3经验风险最小化ERM(Empirical Risk Minimization):

在这里插入图片描述
→若学习算法是ERM且稳定的,则假设空间H可学习

未完待续,喜欢的朋友可以关注后续文章~

机器学习基础系列文章回顾:
机器学习基础(一):简介
机器学习基础(二):模型评估与选择
机器学习基础(三):决策树
机器学习基础(四):特征选择与稀疏学习

参考书目:
周志华.《机器学习》

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值