学习笔记-吴恩达深度学习课程二-深度学习的实用层面

最新推荐文章于 2024-06-16 11:02:33 发布

jyq小香猪猪

最新推荐文章于 2024-06-16 11:02:33 发布

阅读量67

点赞数

分类专栏：吴恩达视频文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/weixin_44853414/article/details/114582778

版权

吴恩达视频专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.1训练集、测试集、验证集，这三者最好来自同一分布，搭建训练验证集和测试集能够加速神经网络的集成。

1.2方差、偏方差
欠拟合，即逻辑不能很好的拟合数据集
过拟合，即为了用更好的逻辑来拟合每一个数据，得到了很复杂的分类器

适度拟合
高偏差和高方差的解决方法
1.3正则化
一般过度拟合数据（高方差问题）解决方法通常是正则化或者准备更多数据。
正则化就是在原有的成本函数上加一个含有正则化参数的项lambd
L2正则化，也称为权重衰减
在这里插入图片描述
L1正则化（会导致w变得稀疏，含有大量0）
过拟合解决方法-正则化
1.dropout
keep-prob表示保留一个隐藏单元的概率
Inverted dropout (反向随机失活)——用来除以keep-prob,确保期望值不变
2.Data augmentation
当出现过拟合，需要增加训练数量来解决时，就可以通过图片的翻转来实现数据增广（水平或者垂直等其他图片操作或者强变形处理都视为新图片），也就是数据集的增加。
3.Early stopping
让成本函数j提前在已经较小的值结束整个神经网络的训练，从而获得找出w的较小值、中间值和较大值，而无需尝试L2 的正则化超级参数lamda的很多值，但缺点是，该处理方式会提前结束j，让j达不到最小的时候得到参数，虽然这样可以减小过拟合。换句话来讲，就是该处理方式不能同时满足j小和过拟合小的目的。

2归一化输入

Normalizing training sets

3梯度爆炸和梯度消失

梯度爆炸和梯度消失就是指下降的导数或者坡度有时会很大或者很小。就是，当出现与层数相关的激活函数会出现指数式的变化
为了解决这个问题，可以从权重的初始化改变
梯度的数值逼近：1.双边检验法
***梯度检验-仅用来debug ***
1.把所有参数转换成一个巨大的向量数据，即将w转换成个向量矩阵

jyq小香猪猪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习笔记-吴恩达深度学习课程二-深度学习的实用层面

1.1训练集、测试集、验证集，这三者最好来自同一分布，搭建训练验证集和测试集能够加速神经网络的集成。1.2方差、偏方差1.3正则化一般过度拟合数据（高方差问题）解决方法通常是正则化或者准备更多数据。正则化就是在原有的成本函数上加一个含有正则化参数的项lambdL2正则化，也称为权重衰减L1正则化（会导致w变得稀疏，含有大量0）过拟合解决方法——dropoutkeep-prob表示保留一个隐藏单元的概率Inverted dropout (反向随机失活)——用来除以keep-prob
复制链接

扫一扫