（《机器学习》完整版系列）第12章计算学习理论——12.5 无限假设空间（特殊的“无限”：若“打散”产生的的VC维有限）

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129633839

若样本集 $D$ 能被 $\mathcal{H}$ “打散”，简记：表12.1 中的行被 $\mathcal{H}$ 划掉称为“对分”，表12.1 被 $\mathcal{H}$ 划掉称为“打散”。
$\mathcal{H}$ 能“打散”的最大表（最大 $m$ ）称为 $\mathcal{H}$ 的VC维，
可证明任何VC维有限的假设空间 $\mathcal{H}$ 都是（不可知）PAC可学习的。

无限假设空间

对于“无限”常常是束手无策，但我们可考虑某些特殊的“无限”，即含有某种“有限”，如“VC维”。

给定样本集 $D=\{\boldsymbol{x}_i\}_{i=1}^m$ ，对于二分类 $D$ 的所有可能的标记（不是指真实标记），有 $2^m$ 种情况，见表12.1 。

其中，每一行表示一种分类的可能，将该行标记形成的二进制数转换成十进制作为行编号。

给定假设空间 $\mathcal{H}$ ，设 $h_1\in \mathcal{H}$ ，将其作用于 $D$ 的所有样本
$\begin{align} h_1(D)=(h_1(\boldsymbol{x}_1),h_1(\boldsymbol{x}_2),\cdots,h_1(\boldsymbol{x}_m)) \tag{12.18} \end{align}$
则 $h_1(D)$ 右侧一定是表12.1 的某一行（画线删除该行），类似地， $h_2(D)$ 右侧一定是表12.1 的某一行（画线删除该行）， $\cdots$ 如此类推直至用完 $\mathcal{H}$ 中的 $h$ 。

由于 $\mathcal{H}$ 无限，而表12.1 中的行有限，按上述方法画上删除线，那么，一定会出现重复删除，并且有的会有无限次重复。我们关心的是：用完 $\mathcal{H}$ 中的 $h$ ，表12.1 中的行是否还有剩下的行？当然有可能。

$\mathcal{H}$ 中的每个 $h$ 都有对应的式(12.18)（以及对应的删除线），有删除线的行就形成了一个集合
$\begin{align} \mathcal{H}_D=\{(h(\boldsymbol{x}_1),h(\boldsymbol{x}_2),\cdots,h(\boldsymbol{x}_m))|h\in \mathcal{H}\} \tag{12.19} \end{align}$
该集合的元素的个数为 $|\mathcal{H}_D|$ ，也即为删除的行数（重复的删除线不重复计数），因表12.1 中的行为 $2^m$ ，故 $|\mathcal{H}_D|\leqslant 2^m$ 。

由式(12.19)知， $|\mathcal{H}_D|$ 与 $D$ 有关，现对 $D$ 的大小限制：让它的大小固定为给定的 $m$ ，则仍有许多 $|\mathcal{H}_D|$ （因取样不同），但其最大值只有一个，记为： ${\Pi}_{\mathcal{H}}(m)$ ，即
$\begin{align} {\Pi}_{\mathcal{H}}(m) =\max_D(|\mathcal{H}_D|:|D|=m) \tag{12.20} \end{align}$
则式(12.20)只与 $m$ 相关，视为 $m$ 的函数，称为 $\mathcal{H}$ 的增长函数，综合表述为【西瓜书式(12.21)】。

式(12.18)实现了对 $D$ 的一种二分类（标记为1和0），称为对 $D$ 的“对分”， $D$ 的所有可能的“对分”都是表12.1 中的行，而 $\mathcal{H}$ 在 $D$ 上能实现的“对分”为 $|\mathcal{H}_D|$ 个（最多为 ${\Pi}_{\mathcal{H}}(m)$ 个）。若存在某个 $D$ 使得
$\begin{align} |\mathcal{H}_D|=2^m \tag{12.21} \end{align}$
则
$\begin{align} {\Pi}_{\mathcal{H}}(m)=2^m \tag{12.22} \end{align}$
这时称样本集 $D$ 能被 $\mathcal{H}$ “打散”（ $D$ 的所有标记情况都能被对分，表12.1 中的行都被划掉），简记：表12.1 中的行被 $\mathcal{H}$ 划掉称为“对分”，表12.1 被 $\mathcal{H}$ 划掉称为“打散”。

若大小为 $m$ 的 $D$ 中，存在某个 $D^{'}$ 能被 $\mathcal{H}$ “打散”，则从 $D^{'}$ 中删除一个样本，得到样本集 $D^{''}$ ，它的大小为 $(m - 1)$ ，而 $D^{''}$ 的表12.1 为 $D^{'}$ 的表12.1 中删除某一列（对应于删除的样本），并由此引起的相同的行的合并。故样本集 $D^{''}$ 也能被 $\mathcal{H}$ “打散”，这说明“打散”这一性质可以“向下”保持。

“打散”具有覆盖表12.1 的行的特征，当然，表越大越好（ $m$ 越大表越大）， $\mathcal{H}$ 能“打散”的最大表（最大 $m$ ）称为 $\mathcal{H}$ 的VC维，即
$\begin{align} \mathrm{VC}(\mathcal{H})=\max\{m:{\Pi}_{\mathcal{H}}(m)=2^m\} \tag{12.23} \end{align}$