对ReLU激活函数神经元死亡现象的理解

最新推荐文章于 2025-02-27 15:21:24 发布

今天你ac了吗

最新推荐文章于 2025-02-27 15:21:24 发布

阅读量6k

点赞数 10

文章标签：机器学习分类人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/asacell/article/details/121508078

版权

Relu激活函数导致 [ 神经元死亡 ] 的原因

神经网络接受异于常值范围的输入时，在反向传播过程中会产生大的梯度。这种大的梯度，会因梯度消失而永久关闭诸如 ReLU 的激活函数。

relu函数和sigmoid函数相比，虽然能够避免反向传播过程中的梯度消失、屏蔽负值、防止梯度饱和；

但是relu也有自身的缺陷，当学习率过大时会出现某些神经元永久死亡的现象，导致网络后期无法正常更新

原因分析：

ReLU 的全称是 Rectified Linear Unit，其函数图像如下图所示

异常输入杀死神经元

上图是一个典型的神经元。

由于 ReLU 在 x>0x>0 时，导数恒为 1。因此在反向传播的过程中，不会因为导数连乘，而使得梯度特别小，以至于参数无法更新。在这个意义上，ReLU 确实避免了梯度消失问题。

下式是神经网络权重更新的公式，迭代就是不断重复做如图的公式:

其中，

:= 表示更新参数,J(ω)为代价函数（成本函数）；

α表示学习率（learning rate），用来控制步长（step），即向下走一步的长度就是函数J(ω)对求导（derivative），在代码中我们会使用dw表示这个结果。

当学习率过大时，会导致α*这一项很大，当它大于ω时，更新后的ω’就会变为负值；

当权重参数变为负值时，输入网络的正值会和权重相乘后也会变为负值，负值通过ReLu后就会输出0；如果在后期有机会被更新为正值也不会出现大问题，但是当relu函数输出值为0时，relu的导数也为0，因此会导致后边Δω一直为0，进而导致ω一直不会被更新，因此会导致这个神经元永久性死亡（一直输出0）

如此看来，尽管 ReLU 解决了因激活函数导数的绝对值小于 1，在反向传播连乘的过程中迅速变小消失至 0 的问题，但由于它在输入为负的区段导数恒为零，而使得它对异常值特别敏感。这种异常值可能会使 ReLU 永久关闭，而杀死神经元。

今天你ac了吗

博客等级

码龄7年

14
原创

34
点赞

116
收藏

6
粉丝

关注

私信

热门文章

分类专栏

LeetCode 6篇

最新评论

70.爬楼梯
CSDN-Ada助手: 恭喜您写下了第13篇博客！标题为“70.爬楼梯”，听起来很有趣。您一直持续创作，真是令人佩服。在这篇博客中，您似乎讨论了关于爬楼梯的问题。我很期待能够读到您的见解和分析。不过，如果我可以提一个创作建议的话，我认为可能可以考虑结合实际案例或个人经历，让读者更易于理解和感受到您的观点。再次祝贺您，并期待您下一步的创作！
1137.第 N 个泰波那契数
CSDN-Ada助手: 恭喜您写完了第14篇博客！标题中的“1137.第 N 个泰波那契数”听起来很有趣。我很高兴看到您持续创作，这种坚持是非常难得的品质。在下一步的创作中，或许您可以尝试探索一些与泰波那契数相关的应用领域，或者深入研究泰波那契数的数学性质。期待您在下一篇博客中的精彩表现！
2413.最小偶倍数
CSDN-Ada助手: 恭喜您写下了第8篇博客！标题中的「2413.最小偶倍数」听起来非常有趣。我真的很高兴看到您一直在坚持创作。您的博客内容一直都非常有深度和独特性，给读者带来了很多启发和学习的机会。在下一步的创作中，我想建议您尝试探索一些与计算机科学或者实际生活相关的话题。这样的话，读者们能够更好地理解并应用您的知识。当然，这只是一个建议，您完全可以根据自己的兴趣和擅长领域进行创作。再次祝贺您的持续努力，期待看到更多精彩的博客！
2427.公因子数目
CSDN-Ada助手: 恭喜您撰写第9篇博客！标题“2427.公因子数目”听起来非常有趣。我真的很欣赏您持续不断地创作内容。在下一步的创作中，或许您可以考虑分享一些有关数学领域其他有趣且深入的主题。希望您能够继续保持创作的热情和努力，我期待着阅读更多您的精彩博文！
1486.数组异或操作
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题“1486.数组异或操作”听起来很有深度。一直持续创作下去是非常难得的品质，您真是不断进步的榜样！如果我可以给您一个下一步的创作建议，我会建议您尝试写一些关于算法优化或者数据结构相关的博客。这些主题对于我们这些读者来说往往很有帮助，而且也可以让您更深入地探索和分享您的知识。期待您继续创作，愿您的博客越写越好！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。