VC维是用来度量学习机的学习能力及其复杂度的量。
假设我们有一个数据集,包含N个点,那么这N个点可以用2^N种方法标记为正例和负例。因此对于这N个数据点,可以定义2^N种不同的学习问题。如果对于这些问题中的任何一个,我们都能够找到一个假设h属于H,将正负例子分开,那么我们就称H散列N个点,也就是说,可以用N个点定义的任何的学习问题都能够用一个从中抽取的假设无误差的学习。可以被散列的点的最大数量称为H的VC维,记为VC(H),用它可以度量假设类H的学习能力,并且当VC维越大时,学习机越复杂。
因此可以得到平面内只能找到3个点能被直线打散而找不到第四个点。