knitr::opts_chunk$set(echo = TRUE)
Part3主要内容:如果
N
足够大并且某处存在break point,那么
1 VC Dimension
Part3讲到的VC Bound如下所示:
其中 mH(N)<B(N,k)=∑i=0k−1CiN ,当 N≥2,k≥3 ,我们可以找到 B(N,k) 的上界 Nk−1 ,数学上应该可以直接证明的,这里我们简单看图做个说明:
我们从最开始的
M
–>
那么,如果成长函数存在break point且资料量
N
足够大,我们可以得到
VC Dimension定义:最大的非break point,或者说是最小的break point减去1的值。那么:
之前我们说如果break point存在, N 足够大,可以得到
2 VC Dimension Of Perceptrons
想要知道dD perceptrons的VC Dimension,先从1D、2D看起:
猜测d维的perceptrons的VC Dimension为
d+1
,那么证明只需两步:
1.
dVC≥d+1
2.
dVC≤d+1
2.1 Step1 dVC≥d+1
对于step1,只需证明当
d+1
个资料时,存在shatter的情况,就可证明min break point不是
d+1
。注意我们在看是不是break point时,是任意摆放这些
d+1
个点,求最多可以产生多少dichotomy,如果可以产生
2N
个dichotomy,则认为被shatter。
我们按照下面的方式构造点的排列:
每一行代表一个样本点,一共 d+1 行。线性代数知识易知 X 可逆。回到PLA,我们希望找到
2.2 Step2 dVC≤d+1
证明
dVC≤d+1
则需要当资料大小为
d+2
时,任意的种
d+2
个input都不能被shatter。同样的,用矩阵表示:
这个矩阵行数为 d+2 ,列数为 d+1 ,则行向量之间一定线性相关。 XT∗A=0 有解则说明 xT1,xT2,⋯,xTd+2 之间线性相关。因为n元齐次方程组 Ax=0 有非零解的充要条件是 R(A)<n 。对于系数矩阵 XT ,其秩一定不大于行数和列数。所以 R(XT)≤d+1 ,而 A 是
上面我们证明了对于 d 维perceptrons,
证明用反证法证明不能shatter。假设我们在某种 d+2 个资料时能够shatter,那么所有的dichotomy都存在。系数 a1,a2,...,ad+1 的正负与 y 的正负一致,这样的
因为 wTxi 与 ai 符号相同,所以 wTxd+2>0 ,即 yd+2 不能为负。这就与shatter这个前提矛盾了,所以 d+2 时,不能shatter。
综合Step1和Step2,d维的perceptrons的VC Dimension为 d+1 得证!
3 Degrees Of Freedom
自由度的概念怪怪的,和统计学里讲的自由度貌似也不太一样。按照Week7里讲的,叙述一遍吧。
上图中
W
又名features,模型中可以自由变动的参数数量即自由度。而VC Dimension代表二分类时有效的自由度,即
4 Interpreting VC Dimension
这一节进一步探讨VC Dimension。之前的VC Bound如下:
这里把Bound记为 δ ,根据上面的不等式,出现Bad的概率最大不超过 δ 。那么也可以说出现good的概率最小不小于 1−δ ,那么可以进一步推导:
ε
表现了
H
的泛化能力,
至此我们推导出泛化误差 Eout 的上界。这个上界又称为模型复杂度。显然模型复杂度和 N,dVC,δ,Ein 有关。下面是 Eout,Ein ,模型复杂度随 dVC 变化的关系:
至于这个图为什么是这样,暂时只能把它当做结论来记。从图上可知:
*
dVC
越大:
Ein
越小,
Ω
越大,模型越复杂
*
dVC
越小:
Ein
越大,
Ω
越小,模型越简单
* 随着
dVC
增大,
Eout
会先减小再增大
单纯的通过增大
dVC
来找最小的
Ein
不可取,因为会增加模型复杂度和
Eout
。
下面介绍另一个定义:样本复杂度(Sample Complexity)。如果选定
dVC
,样本数据选择多少合适呢?看下面的例子:
按照题设条件,满足
δ=0.1
的样本数量为29300。
N
大约是
5 Summary
这一节课整体上乱糟糟的,介绍了VC维、自由度、模型复杂度等等,并且证明了
d
维的Perceptrons的VC维是
综合这四篇文,当VC维有限且资料足够多,可以满足
Ein≈Eout
。而
Ein≈0
则需要
dVC
取到合适的值,因为
dVC
过大,虽然
Ein
很小,但是会导致
Eout
增大。
6 Ref
[1] http://beader.me/mlnotebook/section2/vc-dimension-three.html
[2] http://blog.csdn.net/red_stone1/article/details/71191232
2018-01-29 于杭州