林轩田机器学习基石笔记(第26节)——VC Dimension

复习上限函数

在第23-24节中,我们获得了成长函数的上限函数,并且上限函数又被被多项式 Nk1 N k − 1 所包含住,即 k1i=0 ∑ i = 0 k − 1 会被 Nk1 N k − 1 所包含住,如下图:
这里写图片描述

k1i=0 ∑ i = 0 k − 1 Nk1 N k − 1 的关系如下面两个表所示:
这里写图片描述

基于以上关系,所有的成长函数都将会被 Nk1 N k − 1 所包含住,即今后我们写成长函数的时候不必再一个个分开来写,而是直接写成 Nk1 N k − 1

复习VC Bound

在将VC Bound的时候我们推出如下公式:
这里写图片描述
因为 mH(2N) m H ( 2 N ) 是成长函数,当N足够大,且 k3 k ≥ 3 的时候,成长函数最终又被多项式 Nk1 N k − 1 包含住,所以上面的式子可以用 Nk1 N k − 1 加以替换,结果如下:
这里写图片描述

VC Dimension

那么什么是VC Dimension呢?所谓的VC Dimension其实就是break point之前的那个点,比如break point为k,那么k-1就是VC Dimension,用 dVC=k1 d V C = k − 1 来表示。

  • NdVC N ≤ d V C ,则可以被hypothesis shatter,因为肯定能够做出 2N 2 N 条线来分割所有的hypothesis
  • N>dVC N > d V C ,则肯定不能被hypothesis shatter

因为 dVC=k1 d V C = k − 1 ,所以又有:
这里写图片描述

现在我们来回顾之前介绍到的四种成长函数对应的四种VC Dimension,分别如下:
这里写图片描述
观察上图会发现由于convex sets没有break point,因此VC Dimension会趋向于无穷;之前我们一直找不到上限函数的2D perceptions的上限函数也被我们成功找到了,即 N3 N 3 .

找到VC Dimension有什么意义呢?

我们知道机器学习的最终目的是从Hypothesis Set中找到一条合适的g,但是Hypothesis Set中可能有很多备选的g,结果会造成程序一直不停的跑无法停止下来。
所以我们需要找到一个点break point,当程序运行到该处的时候能够停止下来。所以说有break point的Hypothesis Set才是好的Hypothesis Set。
那么现在我们也可以说只要有VC Dimension的Hypothesis Set就是好的Hypothesis Set。

本节到此结束

===========================懵逼分割线===========================

欢迎大家加入Q群讨论:463255841

===========================懵逼分割线===========================

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值