浅谈一种最严重的过拟合

最新推荐文章于 2022-05-26 17:20:38 发布

算法channel

最新推荐文章于 2022-05-26 17:20:38 发布

阅读量1.1k

点赞数

本文链接：https://blog.csdn.net/xo3ylAF9kGs/article/details/105897759

版权

本文探讨了数据过拟合的极端情况，即模型完全拟合所有训练点，导致训练集准确度近乎100%。通过拉格朗日插值方法示例，展示了模型参数与样本数量相等时的过拟合问题。为提升模型泛化能力，文章建议采用正则化，如L1正则化使参数稀疏，或者选择更简单的模型，如线性回归来防止过拟合。此外，对于神经网络，还提到了其他防止过拟合的策略。

摘要由CSDN通过智能技术生成

数据过拟合最严重的情况，便是模型能完美“适应”所有点。

如下图便直观形象的展示出这种最严重的的过拟合情况：

模型几乎拟合所有点，也就是在训练集上的准确度接近 100%，这类模型有什么特点呢？不妨看看这个模型的参数：

        1.24700471e-13, -2.35752755e-11,  2.06759733e-09, -1.11665116e-07,
        4.15722794e-06, -1.13161697e-04,  2.33087852e-03, -3.70886530e-02,
        4.61321531e-01, -4.50943817e+00,  3.46373724e+01, -2.07949995e+02,
        9.65158102e+02, -3.40164962e+03,  8.85765503e+03, -1.63366853e+04,
        1.99303609e+04, -1.41930185e+04,  4.37094529e+03,  2.87198980e+00

一共有 20 个，正好等于需要拟合的点数。

以上图形是用拉格朗日插值方法拟合出来的，借助 scipy 包完成插值，代码如下所示。

数据准备阶段：

from scipy.interpolate import lagrange
import

最低0.47元/天解锁文章

算法channel

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
浅谈一种最严重的过拟合

数据过拟合最严重的情况，便是模型能完美“适应”所有点。如下图便直观形象的展示出这种最严重的的过拟合情况：模型几乎拟合所有点，也就是在训练集上的准确度接近 100%，这类模型有什么特点呢？...
复制链接

扫一扫