林轩田机器学习基石Lecture 6: Theory of Generalization

@Lecture 6: Theory of Generalization

Restriction of Break Point

确定假设H的成长函数是限定的,也就是H关于样本个数N的成长函数,如果mH(N)<2N,则存在break point
在这里插入图片描述
H的个数要满足任意k个point不能完全shatter的条件

Bounding Function: Basic Cases

在这里插入图片描述

扩展到无论分类规则是什么,证明B(N,K)都远小于N的多项式
B(N,K)满足:B(N,1)=1, 当N<K时,B(N,K)=2的N次方,当N=K时,B(N,K)=2的N次方-1
在这里插入图片描述注意,B是mH的上限,不一定相等

Bounding Function: Inductive Cases

继续填表,求B(4,3),看B(4,3)和B(3,?)的关系
在这里插入图片描述
分开看a+beta 和a的限制在这里插入图片描述
因此,放缩后就可以得到B(N,K)的上界
在这里插入图片描述
相当于经过上述证明,我们找到了H的成长函数mH的上限函数的上限,由此证明出来mH是远小于2的N次方的,会被N的多次项函数bound住

A Pictorial Proof

把mH会被N的多项式bound住代到坏事情发生的公式里面
在这里插入图片描述

第一步,因为上图公式里面的Eout(h)是一个未知的,需要替换掉,思路,拿在in的数据里面的再次取样得到的E’in代换Eout,因为Ein的概率期望为Eout
在这里插入图片描述
第二步,使用mH来衡量坏事发生概率的重叠度
在这里插入图片描述

第三步通过抽样还替换在这里插入图片描述在这里插入图片描述
在这里插入图片描述

到这里就证明了随着在2维空间的判别问题上,只要存在break point,H的个数会被bound住,Ein和Eout的差距也会被bound住,也就是说N的个数足够大时,Ein和Eout的值相差不会太大,选看到的样本上的Ein最小的h,在看不到的数据上的表现应该也是比较好的,机器学习算法PLA可行。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值