这一节主要描述了本人对VC维中
该式
推导为
推导过程的个人理解,若有理解不当之处,望各位指正!
step1描述:
step1理解:
由两个因素决定,一个是假设h(h属于假设空间H),还有一个是N个input的样本集(这N个样本集来自无穷的样本空间)。当h和input的样本集确定时,
的值也就确定了。
只由假设h决定,因为
是指假设h作用在样本空间中的每一个样本所产生的期望误差。
当假设h确定时,我们在样本空间中随机取N个input样本,每取一次就会产生一个值,重复很多次,利用统计学方法,可以得到
的概率密度分布图如下图所示。而且由
的定义可知这个概率密度分布图的峰值处对应的值差不多就是
的值。(根据https://blog.csdn.net/qq_29508953/article/details/86661634中
,
的定义,
值介于0-1之间)。
图1
当假设h确定时的概率值可以用下图蓝色填充部分的面积值表示:
图2
在step1中,由于作用的是无穷的样本空间,对于假设空间H来说,当假设h发生一点点变化时,
的值就改变了,所以
有无限种。那么就可以推出以下公式:
m趋向于无穷。
这样的话公式就推不下去了。。。
为了解决这个问题,我们在样本空间中任意取N个样本作为测试集,得到,代替
。由于
也是通过该方法得到的,所以
和
在相同的假设h作用下,是独立同分布的。
step1证明:
首先step1的不等式就等价于存在一个h属于H满足:
令。
和
在相同的假设h作用下,是独立同分布的,所以
也独立同分布,所以两者的联合分布公式:
。
对于公式3中的
由图1可得,
;
由于独立同分布,所以
;
并且,因为如果
小于1,则图1围成的总面积会小于1。
根据https://blog.csdn.net/qq_29508953/article/details/86661634中,
的定义,
值介于0-1之间,所以
。
围成的面积为下图蓝色部分面积
图3
所以
然后再看公式3中的
以及
所以以及
所以
所以
所以
综上
step2与step3描述:
step2与step3证明:
我们在样本空间中随机取N个input样本设为D,D保持不变,令h在假设空间H上改变时,最多有
种可能;
同样我们在样本空间中随机取N个input样本设为D’,D’保持不变,令h在假设空间H上改变时,最多有
种可能;
因为D和D'可能重叠,所以当D与D'不变,h在假设空间H上改变时,最多有
种可能。
公式(6)中用的是一种无放回抽样的霍夫丁不等式,与常规的霍夫丁不等式边界一致,这种情形的证明可以看Hoeffding在1963年发表的论文。如果需要一个在无放回抽样的例子中更好的边界,可以查看Serfling在1974年发表的论文。