deep learning.ai 第二课笔记-改善深层神经网络：超参数调试、正则化以及优化

最新推荐文章于 2022-07-18 22:38:30 发布

catbird233

最新推荐文章于 2022-07-18 22:38:30 发布

阅读量351

点赞数

分类专栏： deeplearning.ai笔记

本文链接：https://blog.csdn.net/lrt366/article/details/81912313

版权

deeplearning.ai笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文介绍了深度学习中的超参数调试、正则化及优化方法。包括数据集划分、偏差与方差问题、正则化（如L2范数、dropout）、优化算法（如动量梯度下降、RMSprop、Adam）以及学习率衰减。还讨论了batch正则化的作用，并提出了超参数调整的策略。

摘要由CSDN通过智能技术生成

第一周：深度学习的实用层面

1.数据集的划分：过程一般是训练集进行训练，验证集进行模型的迭代验证寻找最好的模型，最后在测试集上无偏评估。

当需要无偏估计时：划分为训练集，验证集，测试集

不需要无偏估计时：也可以划分为训练集和验证集

2.对于偏差和方差的问题，高偏差对数据的拟合不够好-欠拟合，高方差则是过拟合。

为了理解偏差和方差，需要理解训练集错误率和验证集错误率。

如果最优误差（贝叶斯误差，比如说人眼的误差）为0，且训练集和验证集来自同一分布，如图：

（1）高方差：如果训练集上的错误率很低但验证集上很高，则我们过拟合了训练集的数据，而验证集没有充分交叉验证

（2）高偏差：训练集上的错误率高，验证集上错误率只比训练集高一点点，我们欠拟合训练集

（3）高方差，高偏差：训练集上的错误率高，验证集上的错误率更高

（4）低方差，低偏差：训练集，验证集上的错误率都很低

3.不同解决方法：

（1）检查训练集性能，对于高偏差（欠拟合）：需要重新选择算法，扩大网络规模（选择深度的隐藏单元更多的神经网络等），或花更多时间训练

（2）解决了欠拟合之后，一旦偏差降到可接受范围，再检查验证集方差，如果验证集的方差高（过拟合），解决方法一般是寻找更多的数据，或者正则化来减少过拟合

4.正则化一般是给W做约束，因为W是一个包含了绝大部分的参数的权重矩阵，b则是一个参数，对结果没什么影响，logistic回归一般用L2范数，而神经网络的L2范数则叫做弗罗贝尼乌斯范数（frobenius）

为什么设置正则化可以防止过拟合？直观上理解就是如果正则化参数λ设置地足够大，权重矩阵W被设置为接近于零的值，直观上说就是把各个隐藏单元的权重设为0，于是消除了这些权重单元的许多影响，于是这个网络则被简化为一个较小的网络，小到如同一个逻辑回归单元，但深度却很深，于是可以把模型向高偏差的状态引导，我们要寻找一个λ，让模型适度拟合。

5.dropout正则化（随机失活）：

（1）反向随机失活（inverted dropout）如下，通过除keep_prob保持a[3]的期望不变