吴恩达深度学习（二）之改善深层神经网络：超参数调试、正则化以及优化

最新推荐文章于 2024-04-12 12:52:16 发布

pku第一菜

最新推荐文章于 2024-04-12 12:52:16 发布

阅读量409

点赞数 1

文章标签： tensorflow 神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40423617/article/details/108322407

版权

改善深层神经网络：超参数调试、正则化以及优化的目录

第一周深度学习的实用层面
第二周优化算法
第三周超参数调试，Bacth正则化和程序框架

第一周深度学习的实用层面

训练集，交叉验证和测试集的比例选择

1.对于小规模数据时，10000及其以下，可以使用6：2：2
2.对于大规模数据时，一百万及其以上，应该使用98：1：1 or 99.5:0.4:0.1

偏差与方差

检测规则

训练集，交叉验证集，测试集要来自同一分布，例如图像识别中所有这三者的图片大小应完全相同

种类

高偏差（欠拟合）：训练集和交叉验证集误差都很高，但是比较接近
高方差（过拟合）：训练集误差很小，交叉验证集误差很大
高偏差和高方差同时存在：训练集和交叉验证集误差都很大，并且二者误差相距很远
正确拟合：训练集和交叉验证集误差都很小
注意，也可以用准确率误差来表示，如下图所示：
在这里插入图片描述

正则化(解决 overfitting)

正则化输入

如果输入特征之间的范围变化过大，那么要归一化
即X-X.mean()/X.var()

L1，L2正则化

运用于逻辑回归（L1 AND L2）

在这里插入图片描述
注意：L1正则化会导致最后出现很多W向量为0（W最终会稀疏），不太常用

运用于神经网络（L2）

图中W矩阵维度反了
在这里插入图片描述
关于该式的推导即是（一）中的计算图的一点小变形，推导如下：
$L({A^{[L]}},Y) + \frac{\lambda }{ {2m}}{\sum\limits_{l = 1}^L {\left\| { {w^{[l]}}} \right\|} ^2}$

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达深度学习（二）之改善深层神经网络：超参数调试、正则化以及优化

改善深层神经网络：超参数调试、正则化以及优化的目录第一周深度学习的实用层面训练集，交叉验证和测试集的比例选择偏差与方差检测规则种类正则化(解决 overfitting)正则化输入L1，L2正则化运用于逻辑回归（L1 AND L2）运用于神经网络（L2）L2正则化可以降低过拟合的原因dropout正则化流程dropout可以降低过拟合化的原因dropout使用dropout无法定义代价函数的解决方案data augmentationearly stopping步棸缺点梯度的消失与爆炸原由(这里解释清楚了为什么
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。