对于需要拟合的数据(x1,x2,x3…) 我们可以使用一个多项式取拟合这些数据 如果这些数据分布 f(x) 为二次函数
当我们使用一个好的VC dimension 即和原始分布相似的VC dimension 那么我们可以较好的拟合原始数据分别
当我们选择的VC dimension较大的时候 我们同样也可以很好的fit训练数据 但是由于模型过于复杂 可能只是在给定的数据点处较好的拟合数据 泛化能力可能不会这么好
overfitting可能性:
- 使用过大的VC dimension
- 数据存在noise
- 训练样本N数量过小
OverFiting 实验:
对于训练数据分布 十次多项式加噪声生成数据