pytorch学习2

最新推荐文章于 2023-05-28 08:06:45 发布

cencen_binbin

最新推荐文章于 2023-05-28 08:06:45 发布

阅读量173

点赞数

本文链接：https://blog.csdn.net/cencen_binbin/article/details/104396981

版权

本文探讨了机器学习中的过拟合和欠拟合现象，解释了训练误差与泛化误差的区别，提出了增加训练数据、L2正则化和丢弃法作为防止过拟合的策略。接着讨论了神经网络中的梯度消失和梯度爆炸问题，强调了随机初始化模型参数的重要性。最后，介绍了卷积神经网络的基础知识，包括二维互相关运算、特征图和感受野的概念，以及填充的作用。

摘要由CSDN通过智能技术生成

1、过拟合和欠拟合

训练误差和泛化误差在解释上述现象之前，我们需要区分训练误差（training error）和泛化误差（generalization error）。通俗来讲，前者指模型在训练数据集上表现出的误差，后者指模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数，例如线性回归用到的平方损失函数和softmax回归用到的交叉熵损失函数。机器学习模型应关注降低泛化误差。K折交叉验证由于验证数据集不参与模型训练，当训练数据不够用时，预留大量的验证数据显得太奢侈。一种改善的方法是K折交叉验证（K-fold cross-validation）。在K折交叉验证中，我们把原始训练数据集分割成K个不重合的子数据集，然后我们做K次模型训练和验证。每一次，我们使用一个子数据集验证模型，并使用其他K-1个子数据集来训练模型。在这K次训练和验证中，每次用来验证模型的子数据集都不同。最后，我们对这K次训练误差和验证误差分别求平均。过拟合和欠拟合接下来，我们将探究模型训练中经常出现的两类典型问题：
* 一类是模型无法得到较低的训练误差，我们将这一现象称作欠拟合（underfitting）；
* 另一类是模型的训练误差远小于它在测试数据集上的误差，我们称该现象为过拟合（overfitting）。在实践中，我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题，在这里我们重点讨论两个因素：模型复杂度和训练数据集大小。

给定训练数据集，模型复杂度和误差之间的关系：

最低0.47元/天解锁文章

cencen_binbin

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch学习2

1、过拟合和欠拟合训练误差和泛化误差在解释上述现象之前，我们需要区分训练误差（training error）和泛化误差（generalization error）。通俗来讲，前者指模型在训练数据集上表现出的误差，后者指模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数，例如线性回归用到的平方损失函数和softma...
复制链接

扫一扫