过拟合和欠拟合进阶详解：

最新推荐文章于 2024-01-09 01:16:40 发布

下一站、幸福

最新推荐文章于 2024-01-09 01:16:40 发布

阅读量200

点赞数

分类专栏：深度学习人工智能文章标签：深度学习机器学习神经网络

本文链接：https://blog.csdn.net/FLY__1997/article/details/107850751

版权

深度学习同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

人工智能

1 篇文章 0 订阅

订阅专栏

过拟合和欠拟合进阶详解：

首先说说深度学习在干什么，深度学习训练是在训练集上进行的，我们会将数据集以一定比例分为训练集和测试集（一般还有验证集），一个好的训练集的特征空间是基本囊括需要测试泛化性能的测试集特征空间的，深度学习就是要用一个庞大的含有很多参数的式子去完成训练集特征空间到标签的映射，然后泛化到测试集上。由于理想状态下同标签的训练集的有效特征空间（如花朵分类任务中图像中花的部分就是有效特征）是覆盖了测试集的有效特征空间的（同标签下无效特征大概率是分布不同的），又由于训练集中有效特征空间到标签的映射一般需要参数量最少的（如果通过叶子或是背景来预测花的分类那将难以完成），所以如何找到这个最小参数的模型便是我们的任务。

1、欠拟合

欠拟合是由于模型参数和复杂度不够，无法给训练集的特征空间一个达到一定准确率的全局最优点。即参数量和复杂度达不到我们要找的那个正好使用有效特征映射到标签的模型。

2、正好拟合

这种情况就是我们调参时寻找的情况，假设模型的参数和复杂度刚好，那么模型就会对训练集组成的特征空间有一个全局最优的点，此时的全局最优是每个样本的的有效特征到标签的映射，此时是理想状态，对标签无影响的无用特征对标签没有映射关系，这样就用最少最简洁的模型完成了对训练集有用特征到标签的拟合。如果数据集没有问题的话，测试集和训练集的全局最优的点位置是相近的，此时在测试集上的表现性能也极好。