数据过拟合最严重的情况,便是模型能完美“适应”所有点。
如下图便直观形象的展示出这种最严重的的过拟合情况:
![](https://i-blog.csdnimg.cn/blog_migrate/8753079cc68a98c8d3a31cc4c5908672.png)
模型几乎拟合所有点,也就是在训练集上的准确度接近 100%,这类模型有什么特点呢?不妨看看这个模型的参数:
1.24700471e-13, -2.35752755e-11, 2.06759733e-09, -1.11665116e-07,
4.15722794e-06, -1.13161697e-04, 2.33087852e-03, -3.70886530e-02,
4.61321531e-01, -4.50943817e+00, 3.46373724e+01, -2.07949995e+02,
9.65158102e+02, -3.40164962e+03, 8.85765503e+03, -1.63366853e+04,
1.99303609e+04, -1.41930185e+04, 4.37094529e+03, 2.87198980e+00
一共有 20 个,正好等于需要拟合的点数。
以上图形是用拉格朗日插值方法拟合出来的,借助 scipy
包完成插值,代码如下所示。
数据准备阶段:
from scipy.interpolate import lagrange
import