过拟合，欠拟合，梯度消失，梯度爆炸

最新推荐文章于 2024-08-20 17:28:36 发布

一名小菜鸟的学习之路

最新推荐文章于 2024-08-20 17:28:36 发布

阅读量243

点赞数

分类专栏：深度学习pytorch 文章标签：深度学习机器学习神经网络 python pytorch

本文链接：https://blog.csdn.net/wangchao1823385450/article/details/104373858

版权

本文探讨了深度学习和机器学习中常见的两种问题——过拟合和欠拟合。过拟合发生在模型在训练数据上表现良好但在测试数据上表现不佳，而欠拟合则是模型未能达到较低的训练误差。模型复杂度和训练数据集大小是导致这些问题的关键因素。更大的训练数据集有助于减少过拟合，而在模型复杂度较高的情况下，如深度学习，更多的数据尤其重要。

摘要由CSDN通过智能技术生成

过拟合和欠拟合

我们将探究模型训练中经常出现的两类典型问题：
一类是模型无法得到较低的训练误差，我们将这一现象称作欠拟合（underfitting）；
另一类是模型的训练误差远小于它在测试数据集上的误差，我们称该现象为过拟合（overfitting）。在实践中，我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题，在这里我们重点讨论两个因素：模型复杂度和训练数据集大小。

模型复杂度
模型复杂度，我们以多项式函数拟合为例。给定一个由标量数据特征 $x$ 和对应的标量标签 $y$ 组成的训练数据集，多项式函数拟合的目标是找一个 $K$ 阶多项式函数
在这里插入图片描述
来近似 $y$ 。在上式中， $w_k$ 是模型的权重参数， $b$ 是偏差参数。与线性回归相同，多项式函数拟合也使用平方损失函数。特别地，一阶多项式函数拟合又叫线性函数拟合。
给定训练数据集，模型复杂度和误差之间的关系：
在这里插入图片描述
训练数据集大小
影响欠拟合和过拟合的另一个重要因素是训练数据集的大小。一般来说，如果训练数据集中样本数过少，特别是比模型参数数量（按元素计）更少时，过拟合更容易发生。此外，泛化误差不会随训练数据集里样本数量增加而增大。因此，在计算资源允许的范围之内，我们通常希望训练数据集大一些，特别是在模型复杂度较高时，例如层数较多的深度学习模型。

多项式函数拟合

%matplotlib inline
import torch
import numpy as np
import sys
sys.path.append(

最低0.47元/天解锁文章

一名小菜鸟的学习之路

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
过拟合，欠拟合，梯度消失，梯度爆炸

过拟合和欠拟合我们将探究模型训练中经常出现的两类典型问题：一类是模型无法得到较低的训练误差，我们将这一现象称作欠拟合（underfitting）；另一类是模型的训练误差远小于它在测试数据集上的误差，我们称该现象为过拟合（overfitting）。在实践中，我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题，在这里我们重点讨论两个因素：模型复杂度和训练数据集大小。模型...
复制链接

扫一扫

专栏目录