神经网络梯度、反向传播相关问题

最新推荐文章于 2021-12-05 15:26:54 发布

码一码码码

最新推荐文章于 2021-12-05 15:26:54 发布

阅读量644

点赞数 2

文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39586997/article/details/120479839

版权

1、梯度消失、爆炸的原因

由于反向传播机制，若损失函数梯度小于1，就会发生梯度消失；反之则会发生梯度爆炸；

两种情况下梯度消失经常出现，一是在深层网络中，二是采用了不合适的损失函数，比如sigmoid。梯度爆炸一般出现在深层网络和权值初始化值太大的情况下。

2、梯度消失、爆炸的解决方案

（1）预训练+微调

（2）梯度剪切、正则

（3）relu、leaky-relu、elu等激活函数

（4）batchNorm：把每层神经网络任意神经元的输入值的分布强行拉回到接近均值为0方差为1的标准正太分布，这样使得激活输入值落在非线性函数对输入比较敏感的区域

（5）残差结构：

（6）LSTM：通过内部的门可以记住前几次训练的残留记忆

3、RNN容易发生梯度消失，因为激活函数为tanh，导数小于1，且在平时运用时，RNN比较深，使得梯度消失或梯度爆炸的问题会比较明显。

4、神经网络的反向传播

对于BPNN模型&#

最低0.47元/天解锁文章

码一码码码

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络梯度、反向传播相关问题

1、梯度消失的原因由于反向传播机制，若损失函数梯度小于1，就会发生梯度消失；反之则会发生梯度爆炸；两种情况下梯度消失经常出现，一是在深层网络中，二是采用了不合适的损失函数，比如sigmoid。梯度爆炸一般出现在深层网络和权值初始化值太大的情况下。...
复制链接

扫一扫

码一码码码 CSDN认证博客专家 CSDN认证企业博客

码龄7年

50: 原创

39万+: 周排名

61万+: 总排名

4万+: 访问

: 等级

595: 积分

30: 粉丝

76: 获赞

16: 评论

246: 收藏

私信

关注

热门文章

最新评论

youtubeDNN及其优化
DataToBetter: 请问博主，（13）中提到的用于User CF效果如何，我目前训练出来的User embedding之间都高度相似，难以区分相似用户和不相似用户
数据预处理方法综述
m0_60703185: 有价值。
负采样方式
m0_60703185: 够专业！
word2vec及其优化
Mr.姚先森: 兄弟，代码有吗
负采样方式
m0_60703185: 很经典，点赞。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。