深度学习(吴恩达)---过拟合、欠拟合、正则化,随机失活和w的初始化,梯度爆炸和梯度消失

1.

在这里插入图片描述

2.如何降低过拟合出现的概率呢?

(1)将w初始化至合理的值(使用范二式子正则化)
tips:主要在计算损失函数和后向传播中使用
以tanh函数举例
Z=wx+b,当z过大时,y–>1,当z过小时,y–>-1,此时会出现过拟合
为了避免这种情况,只能让w处于一个合适的区间或者精简化模型
在这里插入图片描述
其损失函数变为:(其中^y表示估计值,l表示第l层,k,j表示第k行第j列)
在这里插入图片描述

,其中λ是正则化参数
在这里插入图片描述
(2)精简化模型
采用随机失活算法(dropout)简化神经网络模型,例如在第三层设置keep.prob=0.8表示该隐藏层有20%个隐藏单元会被抛弃。
tips:在前向传播和后向传播中使用。
其主要步骤:
① 初始化矩阵D1 = np.random.rand(…, …)
② 将D1的值转换为0或1
③ 舍弃A1的一些节点(将它的值变为0或False)
④ 缩放未舍弃的节点(不为0)的值,只有进行缩放后才会保证期望值不变

3. 梯度爆炸和梯度消失

在这里插入图片描述
当隐藏层够多且
在这里插入图片描述

此时y的值为
y=1.5L-1*X
此时会出现梯度爆炸
当隐藏层够多且在这里插入图片描述
此时y的值为
在这里插入图片描述

此时会出现梯度消失

4.w的初始化

w=0,则会出现对称现象
w过大会出现梯度爆炸,
w过小会出现梯度消失
w在python中随机初始化都服从(0,1)正态分布,假设Xi=1,
在这里插入图片描述

5.梯度检验

使用梯度校验,检测模型是否出现错误。

  • 19
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值