浅谈一种最严重的过拟合

本文探讨了数据过拟合的极端情况,即模型完全拟合所有训练点,导致训练集准确度近乎100%。通过拉格朗日插值方法示例,展示了模型参数与样本数量相等时的过拟合问题。为提升模型泛化能力,文章建议采用正则化,如L1正则化使参数稀疏,或者选择更简单的模型,如线性回归来防止过拟合。此外,对于神经网络,还提到了其他防止过拟合的策略。
摘要由CSDN通过智能技术生成

数据过拟合最严重的情况,便是模型能完美“适应”所有点。

如下图便直观形象的展示出这种最严重的的过拟合情况:

模型几乎拟合所有点,也就是在训练集上的准确度接近 100%,这类模型有什么特点呢?不妨看看这个模型的参数:

        1.24700471e-13, -2.35752755e-11,  2.06759733e-09, -1.11665116e-07,
        4.15722794e-06, -1.13161697e-04,  2.33087852e-03, -3.70886530e-02,
        4.61321531e-01, -4.50943817e+00,  3.46373724e+01, -2.07949995e+02,
        9.65158102e+02, -3.40164962e+03,  8.85765503e+03, -1.63366853e+04,
        1.99303609e+04, -1.41930185e+04,  4.37094529e+03,  2.87198980e+00

一共有 20 个,正好等于需要拟合的点数。

以上图形是用拉格朗日插值方法拟合出来的,借助 scipy 包完成插值,代码如下所示。

数据准备阶段:

from scipy.interpolate import lagrange
import 
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值