深度学习笔记——梯度消失和梯度爆炸及解决方法

phily123

已于 2022-03-17 21:16:56 修改

阅读量1.4k

点赞数

分类专栏：深度学习学习笔记文章标签：深度学习 pytorch 人工智能

于 2021-11-21 17:44:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/phily123/article/details/121456957

版权

深度学习学习笔记专栏收录该内容

49 篇文章 4 订阅

订阅专栏

梯度消失：

反向传播时随着网络加深梯度逐渐消失，最后导致参数不更新。
原因： 如果使用sigmoid作为激活函数，反向传播时输出对某一层参数的梯度是后面层的参数和后面层的激活函数的导数相乘（而sigmoid函数的梯度是sigmoid(1-sigmoid)),又因为sigmoid函数在（0，1）之间，所以随着网络加深，梯度越来越小接近于零，实际上sigmoid函数的梯度小于0.25。
解决方法：换用激活函数（每层的梯度是激活函数的倒数乘以权重，所以对梯度有影响的是损失函数加权重）；BN（BN将每层的输入拉回到激活函数的非线性敏感区，加大梯度）

梯度爆炸：

（损失函数为nan）梯度大于一，反向传播时随着网络层数加深，梯度越来越大接近无穷大。
原因： 由上可知反向传播梯度的因子有后面每一层的参数相乘，所以如果参数过大，大过激活函数倒数的影响，随着网络加深，梯度会越来越大发生梯度爆炸。
解决方法： 降低学习率；用xavier进行权重初始化；模型裁剪（限制每层的梯度大小）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记——梯度消失和梯度爆炸及解决方法

梯度消失：梯度接近零，反向传播时随便网络加深梯度逐渐消失。解决方法：换用激活函数（每层的梯度是激活函数的倒数乘以权重，所以对梯度有影响的是损失函数加权重）；BN（BN将每层的输入拉回到激活函数的非线性敏感区，加大梯度）梯度爆炸：（损失函数为nan）梯度大于一，反向传播时随着网络层数加深，梯度越来越大接近无穷大。**解决方法：**降低学习率；用xavier进行权重初始化；模型裁剪（限制每层的梯度大小）...
复制链接

扫一扫

专栏目录

phily123 CSDN认证博客专家 CSDN认证企业博客

码龄5年

238: 原创

24万+: 周排名

31万+: 总排名

32万+: 访问

: 等级

2594: 积分

34: 粉丝

111: 获赞

36: 评论

760: 收藏

私信

关注

热门文章

分类专栏

最新评论

BEV基础
weixin_43756818: 请问前辈，bev网络的数据集该怎么标注？一般用什么标注软件？
pytorch_quantization安装
Kind_Jiang: 还是报同样的错误
pytorch_quantization安装
桃桃不说话: This package can be installed as:后面不是有一条指令嘛，按照那个指令安装
pytorch_quantization安装
桃桃不说话: This package can be installed as:后面不是有一条指令嘛，按照那个指令安装
pytorch_quantization安装
qq_45942843: 大佬，报错怎么解决： Traceback (most recent call last): File "<string>", line 36, in <module> File "<pip-setuptools-caller>", line 34, in <module> File "/tmp/pip-install-f8dkkpty/pytorch-quantization_d8a1685900dd4678ae7504e6f9bd7fb8/setup.py", line 137, in <module> raise RuntimeError(open("ERROR.txt", "r").read()) RuntimeError: ########################################################################################### The package you are trying to install is only a placeholder project on PyPI.org repository. This package is hosted on NVIDIA Python Package Index. This package can be installed as: ``` $ pip install --no-cache-dir --extra-index-url https://pypi.nvidia.com pytorch-quantization ``` ########################################################################################### [end of output]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。