深度学习（吴恩达）---过拟合、欠拟合、正则化，随机失活和w的初始化，梯度爆炸和梯度消失

b哦哈嘻w

已于 2023-12-21 20:53:00 修改

阅读量610

点赞数 19

分类专栏：深度学习文章标签：深度学习人工智能

于 2023-12-19 21:54:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54069693/article/details/135095174

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.

在这里插入图片描述

2.如何降低过拟合出现的概率呢？

（1）将w初始化至合理的值(使用范二式子正则化)
tips：主要在计算损失函数和后向传播中使用
以tanh函数举例
Z=wx+b，当z过大时，y–>1,当z过小时，y–>-1，此时会出现过拟合
为了避免这种情况，只能让w处于一个合适的区间或者精简化模型
在这里插入图片描述
其损失函数变为：(其中^y表示估计值，l表示第l层，k,j表示第k行第j列)

,其中λ是正则化参数
在这里插入图片描述
（2）精简化模型
采用随机失活算法（dropout）简化神经网络模型，例如在第三层设置keep.prob=0.8表示该隐藏层有20%个隐藏单元会被抛弃。
tips：在前向传播和后向传播中使用。
其主要步骤：
①　初始化矩阵D1 = np.random.rand(…, …)
②　将D1的值转换为0或1
③　舍弃A1的一些节点（将它的值变为0或False）
④　缩放未舍弃的节点(不为0)的值，只有进行缩放后才会保证期望值不变

3. 梯度爆炸和梯度消失

在这里插入图片描述
当隐藏层够多且

此时y的值为
y=1.5L-1*X
此时会出现梯度爆炸
当隐藏层够多且在这里插入图片描述
此时y的值为

此时会出现梯度消失

4.w的初始化

w=0，则会出现对称现象
w过大会出现梯度爆炸，
w过小会出现梯度消失
w在python中随机初始化都服从(0,1)正态分布，假设Xi=1，
在这里插入图片描述

5.梯度检验

使用梯度校验，检测模型是否出现错误。

关注

19
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
深度学习（吴恩达）---过拟合、欠拟合、正则化，随机失活和w的初始化，梯度爆炸和梯度消失

采用随机失活算法（dropout）简化神经网络模型，例如在第三层设置keep.prob=0.8表示该隐藏层有20%个隐藏单元会被抛弃。Z=wx+b，当z过大时，y–>1,当z过小时，y–>-1，此时会出现过拟合。④　缩放未舍弃的节点(不为0)的值，只有进行缩放后才会保证期望值不变。w在python中随机初始化都服从(0,1)正态分布，假设Xi=1，③　舍弃A1的一些节点（将它的值变为0或False）（1）将w初始化至合理的值。w=0，则会出现对称现象。w过大会出现梯度爆炸，w过小会出现梯度消失。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。