林轩田之机器学习课程笔记（why can machines learn之the VC dimension）（32之7）

最新推荐文章于 2019-04-23 22:08:21 发布

cqychen

最新推荐文章于 2019-04-23 22:08:21 发布

阅读量488

点赞数 1

分类专栏：算法笔记机器学习笔记文章标签：机器学习林轩田 VC维

本文链接：https://blog.csdn.net/cqy_chen/article/details/78888890

版权

机器学习笔记同时被 2 个专栏收录

74 篇文章 1 订阅

订阅专栏

算法笔记

7 篇文章 0 订阅

订阅专栏

概要
VC维的定义
PLA的VC维
VC维的物理直觉
VC维的解释

欢迎转载，可以关注博客：http://blog.csdn.net/cqy_chen

概要

上节讲到了一般化理论，当假设空间中存在断点，资料够多的时候，那么我们可以保证 $E_{in} 和E_{out}$ 接近。

VC维的定义

上节课我们证明了VC 边界。
这里写图片描述
同时，根据霍夫丁不等式；

这里写图片描述
当
1）假设空间存在断点
2）资料足够大
3）假设空间中存在一个假设函数，使得 $E_{in}$ 足够小。

那么我们就可以得到机器学习是可行的。
VC维的定义是来自上节中我们讲到的断点。
VC维是在假设空间中，给定资料足够大的情况下，最大能够shatter点的个数，是不是很像断点的定义，断点是指第一个不能被shatter点的个数。所以。

d v c =' m i n i m u m k' - 1

$d_{vc}='minimum k '-1$
当资料量小于

dvc $d_{vc}$ ，那么我们的资料可能会被shatter掉，当资料量大于

dvc $d_{vc}$ 一定不能被假设空间shatter。所以我们的成长函数可以表示为：

m H \leq N d v c

$m_{H}\leq N^{d_{vc}}$
如下表示了4种情况下的VC 维情况。
这里写图片描述

当vc维是有限的情况下，会保证机器学习可行。
同时vc维和演算法A无关，和分布P无关，和目标函数

f $f$ 无关。
这里写图片描述

在坏的情况下，也保证是可以学习的。

如果存在一个N笔资料不能被shatter，那么 $d_{vc}$ 是小于N呢？答案是不是的，只有任意N笔资料不能被shatter才行， $d_{vc}是指的最大能够shatter的个数$

PLA的VC维

我们以二维空间下的PLA为例，假如资料是线性可分的，那么我们知道假设空间中存在 $g$ 使得 $E_{in}=0$

又因为我们知道二维空间下的VC维是有限的，所以我们在资料量足够大的情况下证明 $E_{out}$ 也接近0。

这是在二维的情况下，那么在三维，四维或者更高维度呢？VC维到底是多少呢？
我们知道PLA在1维的时候， $d_{vc}=2$
在二维的时候， $d_{vc}=3$
那么再N维的时候是不是 $d_{vc}=N+1$ ？
如果要证明 $d_{vc}=N+1$ ，需要证明 $d_{vc}\leq N+1$ ,且 $d_{vc}\geq N+1$

下面进行证明，首先证明 $d_{vc}\geq d+1$

要证明 $d_{vc}\leq d+1$ ,那么就是对于任意的d+2个点都不能shatter。

同理，我们给定(d+2)*(d+1)的一个矩阵，那么这个矩阵一定是线性相关的。所以总有一笔资料是可以用其他资料来表示的。那么就会导致其他的资料确定了之后，那么这笔资料就确定了，而shatter是要表示任意的两种情况，现在却是确定的。就是表示任意的d+2笔资料是不能被shatter的。

所以证明了d维的PLA的vc维是d+1。

VC维的物理直觉

上面中我们其实证明了假设空间的维度和VC维的关系。
比如上面的，PLA的维度和VC维度是有关系的，这也是为啥是叫VC 维。

VC维的物理意义其实就是在二分类的情况下，假设空间的自由度。或者说是维度。就像上面的旋钮的个数。而对应的是一般情况下算法的参数个数，比如为什么神经网络容易过拟合，就是因为参数太多了，vc维太大导致的嘛。
我们再回到第五节讲到的M，看看M和 $d_{vc}$ 的关系。

根据霍夫丁不等式，当M很小的时候，对应 $d_{vc}$ 也比较小，那么会导致假设空间中备选函数少，那么久不太可能使得 $E_{in}$ 比较小。但是 $E_{in} 和 E_{out}$ 和很接近。
同理当M很大的时候，可以得到相应的结论。

VC维的解释

在霍夫丁不等式中，我们知道坏事情发生的概率是在一个范围内，反过来讲就是好事情限定在1减去这个概率中。
如下图所示：

上面的一张图就解释了为啥当我们选用很复杂的模型的时候，就是vc维比较大，模型复杂度高，这样E(out)也会变大，这就gg了。
所以这里也建议在机器学习中不要一上来就采用复杂的模型，一般是从简单的模型开始，比如LR，svm等。

我们再来看看数据量大小的评估

这里假设坏事情发生的概率 $\delta =0.1$ 就是希望在未知样本的正确率达到90%。同时呢 $\epsilon=0.1$ 。就是 $E_{in}和E_{out}$ 相差比较近。采用2D的PLA。
就得到
1）如果我们需要达到这样的小姑，需要10000* $d_{vc}$ 的样本量就是30000个点。
2）实际过程的时候，其实只需要10* $d_{vc}$ 。

为啥差异这么大呢？如果你仔细看了整个推导过程就能够发现，这里用了太多的上界叠加。

又四个点：
1）霍夫丁不等式是对容易的分布，任意的目标函数都成立的，一般来说我们的资料都是有特定分布得。
2）我们使用了成长函数来估计假设空间的大小
3）我们用了 $N^{d_{vc}}$ 来估计成长函数，这就放的很宽松了
4）我们使用了叠加的方式，对于发生不好几率的情况下。

所以这些状况进行了叠加导致通过公式计算需要大量的样本，实际情况则不然。但是要想在公式上进一步压缩，现在看来还不太行。

欢迎转载，可以关注博客：http://blog.csdn.net/cqy_chen

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

cqychen

关注关注

1
点赞

踩

1

收藏

觉得还不错? 一键收藏

0
评论

林轩田之机器学习课程笔记（why can machines learn之the VC dimension）（32之7）

概要VC维的定义PLA的VC维VC维的物理直觉VC维的解释欢迎转载，可以关注博客：http://blog.csdn.net/cqy_chen概要上节讲到了一般化理论，当假设空间中存在断点，资料够多的时候，那么我们可以保证Ein和EoutE_{in} 和E_{out}接近。VC维的定义上节课我们证明了VC 边界。同时，根据霍夫丁不等式；当 1）假设空间存在断点 2）资料足够大
复制链接

扫一扫

专栏目录

【林轩田】机器学习基石（七）——VC维

sjz_hahalala479的博客

08-04 1214

Lecture 7: VC Dimension VC维 Definition of VC Dimension VC维的定义复习1 上节课，林教授讲到了，当样本NNN足够大，且成长函数mH(N)mH(N)m_{H}(N)存在断点kkk时，可以概率性地推出Eout≃EinEout≃EinE_{out} \simeq E_{in} 即有断点k的mH(N)≤B(N,k)≤∑i=0k−1(...

林轩田-机器学习基石课堂笔记（七） The VC Dimension

sinat_33397120的博客

02-21 406

1、Definition of VC Dimension我们上次学习到，如果我们的假设空间存在Break Point，那么它一定存在成长函数mH(N)被某个上限函数B(N,k)所约束，这个上限函数也会被某个多项式约束，而这个多项式最高项为N^(k-1)。因此我们可总结为：①我们需要有一个好的hypothesis，也就是存在Break Point。②我们需要有一个好的数据集D，也就是一个比较大的D。...

参与评论您还未登录，请先登录后发表或查看评论

林轩田机器学习基石笔记（第27节）——VC Dimension of Perceptrons

神兽乌鸦

09-09 465

一、复习2D PLA算法如下图所示，左边红色部分表示如果数据集DDD是线性可分的情况下，PLA算法最终会停下来，我们会得到一条能够把所有数据都二分为两类的线段，该线段能够保证在已知的数据上犯错的概率为0，即Ein(g)=0Ein(g)=0E_{in}(g)=0。图中右边部分，则通过霍夫丁不等式从侧面证明了如果我们数据量够大，并且dVCdVCd_{VC}已知的情况下，我们可以保证Ein(g)...

机器学习基石笔记7——为什么机器可以学习（3）

weixin_30460489的博客

02-25 91

转载请注明出处：http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习（4） 机器学习基石笔记5——为什么机器可以学习（1） ...

机器学习基石——VC维浅谈

qq_29508953的博客

01-31 776

VC维这个概念很重要，关于机器学习中预防过拟合的一些操作都可以用这个概念解释。http://www.flickering.cn/machine_learning/2015/04/vc%E7%BB%B4%E7%9A%84%E6%9D%A5%E9%BE%99%E5%8E%BB%E8%84%89/中对VC维有非常详细的介绍，本文是对其的一些整理与理解。了解VC维之前，需要知道一个Heoffding不...

林轩田《机器学习基石》课程笔记7 -- The VC Dimension1

08-03

介绍到这，我们发现M与是成正比的，从而得到如下结论：下面，我们将更深入地探讨VC Dimension的意义。首先，把VC Bound重新写到这里：根据之前的泛化

台湾大学林轩田机器学习基石笔记_红色石头pdf

05-12

《台湾大学林轩田机器学习基石笔记》是由著名学者林轩田教授编著的一份深入浅出的机器学习教程，这份资源因其详实的内容和易读性被广大学习者推崇，尤其是红色石头版本更是其中的精华。PDF格式的文档不仅方便了读者...

台湾大学林轩田的机器学习技法讲义和笔记.zip

07-16

台大林轩田的机器学习技法 Pdf 一共16个PDF ，是网上视频的相关配套资料，主要是林轩田老师的讲解机器学习的一些主要讲义资料

台大林轩田-机器学习基石（课程笔记+作业代码）.zip

最新发布

04-17

机器学习是一种人工智能（AI）的子领域，致力于研究如何利用数据和算法让计算机系统具备学习能力，从而能够自动地完成特定任务或者改进自身性能。机器学习的核心思想是让计算机系统通过学习数据中的模式和规律来实现...

林轩田《机器学习技法》课程笔记7 -- Blending and Bagging1

08-03

介绍的第一种方法：validation。但是，如果可以使用集体智慧，比如一条水平线和两条垂直线组合而成的图中折线形式，就可以将所有的点完全分开，得到了最优化的预

关于霍夫丁不等式的推导

06-13

这篇为霍夫丁不等式的英文论文。

林轩田-机器学习基石课堂笔记（六）Theory of Generalzation

sinat_33397120的博客

02-21 362

1、Restriction of Break Point回顾一下之前学习到的定5义①成长函数mH(N)：假设空间在N个样本点上能产生的dichotomy数量，即样本点在二元分类下的组合情况。②突破点（Break Point）：不能满足完全分类情形（shattered：即N个点所有组合情况都出现）的样本点个数，即不可分出2^N种dichotomy。之前我们学习了四种情况下的成长函数及它们的Break...

台大林轩田·机器学习基石记要

热门推荐

qiusuoxiaozi的博客

06-01 1万+

台大林轩田·机器学习基石记要昨天开始看林轩田的机器学习基石，从今天起开始去粗取精本文在差不多是随堂笔记，可读性不好。。第一讲比较基础，一些概念自己早已经理解了，所以不再做笔记，有点印象的是讲到了ML、DL、AI的一些联系与区别，ML主要是想从数据中学习/逼近一个理想的函数f(x)第二讲讲到了PLA，感知器学习算法，并且证明了线性可分时感知器收敛定理（与Haykin的Neural Networks

【机器学习基石笔记七】-----The VC Dimension（VC维数）

菜菜鸟的博客

09-11 1万+

之前的几节着重介绍了机器学习可行的条件并做了详细的推导解释，机器学习可行必须满足两个条件：假设空间hypothesis sets的size M的大小有限，即当N足够大的时候，那么对于hypothesis sets中任意一个假设g，；利用演算法A从hypothesis sets中选一个函数g，是，则；这两个条件对应着test和train两个过程。train的目的是使损失期望，test的目的...

林轩田机器学习基石笔记（第20节）——成长函数growth function

神兽乌鸦

08-23 5147

Dichotomy 这节课引入一个新的概念Dichotomy，所谓的Dichotomy其实就是我们前一节学到的effective(N)。成长函数（growth function）其实growth function也是我们前面学得effective(N)。引入成长函数的目的是要消除对X的依赖。 Positive Rays 现在假设我们有一堆的X，然后我们要做得就是找到一条线 h(...

林轩田机器学习技法课程笔记（一）线性支持向量机

ben1010101010的博客

03-25 311

机器学习技法本学期在台湾大学交换，选上了林轩田老师的机器学习课程。这是这门课的笔记。老师的讲课方式是，先放自己的课程录影，就是YouTube上面的Machine Learning Techniques:https://www.youtube.com/watch?v=A-GxGCCAIrg&list=PLXVfgk9fNX2IQOYPmqjqWsNUFl2kpk1U2 然后再...

台大林轩田《机器学习基石》学习笔记：可行性（Hoeffding、Multi-binhoeffding、VC bound）

拖延癌患者自愈小记

04-18 4212

台大林轩田《机器学习基石》学习笔记：可行性（Hoeffding、Multi-binhoeffding、VC bound）

机器学习中的VC维数和分类

Machine Learning with Tutors

12-22 6730

VC维数学习VC维要先知道的概念有：增长函数（growth function）、对分（dichotomy）、打散（shattering）和断点（break point） 1.增长函数增长函数表示假设空间H对m个示例所能赋予标记的最大可能结果数。比如说现在数据集有两个数据点，考虑一种二分类的情况，可以将其分类成A或者B，则可能的值有：AA、AB、BA和BB，

林轩田机器学习技法（Machine Learning Techniques）笔记（一）

低级算法工程师w

04-23 821

终于到机器学习技法了，接下来还是尽量保持每章完结就立刻更吧。。基石没有保持写完就更，现在回头不知道自己在写啥，看笔记感觉写得一塌糊涂，感觉翻车了。慢慢改进吧。听说技法挺难的，贴一下大神博客来加持一发：红色石头：感觉总结得非常不错！！ 1. Linear SVM P1 1.1 介绍了本课程之后围绕三个特征转换(feature transforms)的【技法】来讲 1.如何运用特征转换和控制特...

林轩田《机器学习技法》课程笔记14 -- Radial Basis Function Network1

08-03

本篇笔记是林轩田教授《机器学习技法》课程的第14讲，主题聚焦于Radial Basis Function Network（径向基函数网络），这是神经网络的一个特殊变种，它将之前讨论的径向基函数和神经网络概念结合起来。Radial Basis ...

“相关推荐”对你有帮助么？

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交