深度学习中的【误差分析】及【模型性能改善】

mind the gap209

已于 2023-12-23 15:01:57 修改

阅读量1.9k

点赞数 45

分类专栏：深度学习文章标签：深度学习人工智能

于 2023-12-21 19:56:10 首次发布

本文链接：https://blog.csdn.net/qq_60488118/article/details/135131821

版权

3 篇文章 0 订阅

订阅专栏

学完吴恩达老师的深度学习后，对深度学习也有有了较为基础而全面的认识，但是还是没有形成肌肉记忆，有些时候反应不过来，索性开一个专题将自己不太熟悉的部分重新再梳理一遍。整理一些比较容易搞混的地方的，如有疏漏或者错误也欢迎大家批评指正，我们的目标是一起学习进步。

首先需要有正交化的概念，正交化或正交性是一种系统设计属性，其确保修改算法的指令或部分不会对系统的其他部分产生或传播副作用。相互独立地验证使得算法变得更简单，减少了测试和开发的时间。¹

在机器学习中，一个好的模型需要满足如下假设链。

在这里插入图片描述
如果对应不同的问题需要调整时，操作需要尽量满足正交化，即可以减少验证误差，但是不会对其他步造成影响，比如测试误差小，但是验证误差大时，可以使用正则化（L2正则），更大的训练集等，但是最好不要使用早停法，因为早停法也会影响训练误差，这个方法就不是正交的。

在模型不断地训练迭代过程中，我们能碰到四种情况：

对于样本数据，如果选择的模型过于简单，学不到很多信息，此时模型的预测值和真实值误差很大，也就是偏差很大，随着模型的复杂度提升，学到的信息也越来越多，使得偏差逐渐降低。

同样的，随着模型复杂的提升，数据相对模型而言变得简单，使得模型学到了更多的数据噪音，方差也就越来越大。

泛化误差=数据本身噪声+偏差+方差

如下图蓝线,所以需要在中间位置找到一个合适的模型复杂度，使得泛化误差尽可能地小。过于简单导致欠拟合，过于复杂导致过拟合。

这也就是我们常说的训练误差随着模型复杂度地提升而降低，而泛化误差会逐渐增大。训练误差更多和偏差相关，偏差越小，模型就越能拟合训练数据。
在这里插入图片描述

由上图可知，训练误差和偏差走势是一致的，随着模型复杂度增加，都是逐渐减小，所以可以用偏差来描述训练情况，偏差大，说明训练误差大。而泛化误差和偏差和方差都有关,泛化误差=数据本身噪声+偏差+方差。所以可以用偏差和方差来表示训练误差和验证误差。

在这里插入图片描述

当人类水平的错误是 1%。在这种情况下，如果学习算法达到 8%的训练错误率和10%的开发错误率。所以从减少偏差和方差的工具这个角度看，在这种情况下，需要把重点放在减少偏差上。
当人类水平的错误是 7.5%。在这种情况下，如果学习算法达到 8%的训练错误率和10%的开发错误率，需要把重点放在减少方差上。因为此时相对于偏差来说，方差对于模型的影响更大。

贝叶斯错误率或者对贝叶斯错误率的估计和训练错误率之间的差值称为可避免偏差，你可能希望一直提高训练集表现，直到你接近贝叶斯错误率，而训练错误率和开发错误率之前的差值，就说明你的算法在方差问题上还有多少改善空间。

在这里插入图片描述

训练误差大时，直观来看，泛化误差一般也会很大。此时需要着手解决训练误差大的问题。也就是可避免偏差（如果此时方差小，说明在训练初期）。
训练误差小，泛化误差大。说明此时方差大，模型过拟合了，解决过拟合的方法可以参考我写的另一篇博客：深度学习——这可能是你看过的最全的【正则化】的讲解。因为广义的正则化就是为了解决模型过拟合的问题。