[Pytorch 常用函数] 激活函数Relu, Leaky Relu

_孤鸿寄语_

已于 2022-04-20 06:17:29 修改

阅读量4.8k

点赞数 1

分类专栏： Pytorch常见函数文章标签：深度学习 pytorch 神经网络

于 2022-04-20 05:41:00 首次发布

原文链接：https://www.jianshu.com/p/7c57e42e88e8

版权

Pytorch常见函数专栏收录该内容

1 篇文章

订阅专栏

本文探讨了ReLU激活函数的快速收敛和计算优势，以及其负区间导致的死神经元问题。LeakyReLU的引入作为改进，如何解决这个问题并提高学习效率。还提及了Andrew Ng对两者使用的观点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

修正线性单元（Rectified linear unit，ReLU）是神经网络中最常用的激活函数。它保留了 step 函数的生物学启发（只有输入超出阈值时神经元才激活），不过当输入为正的时候，导数不为零，从而允许基于梯度的学习（尽管在 x=0 的时候，导数是未定义的）。使用这个函数能使计算变得很快，因为无论是函数还是其导数都不包含复杂的数学运算。然而，当输入为负值的时候，ReLU 的学习速度可能会变得很慢，甚至使神经元直接无效，因为此时输入小于零而梯度为零，从而其权重无法得到更新，在剩下的训练过程中会一直保持静默。

综上可知，ReLu激活函数的优点是：

1，相比Sigmoid/tanh函数，使用梯度下降（GD）法时，收敛速度更快

2，相比Sigmoid/tanh函数，Relu只需要一个门限值，即可以得到激活值，计算速度更快

缺点是：

Relu的输入值为负的时候，输出始终为0，其一阶导数也始终为0，这样会导致神经元不能更新参数，也就是神经元不学习了，这种现象叫做“Dead Neuron”。

为了解决Relu函数这个缺点，在Relu函数的负半区间引入一个泄露（Leaky）值，所以称为Leaky Relu函数，如下图所示：

带泄露修正线性单元（Leaky ReLU）函数是经典（以及广泛使用的）的ReLu激活函数的变体，该函数输出对负值输入有很小的坡度。由于导数总是不为零，这能减少静默神经元的出现，允许基于梯度的学习（虽然会很慢），解决了Relu函数进入负区间后，导致神经元不学习的问题。

Andrew Ng说：

1，Leaky ReLU函数比ReLU函数效果好，但实际中Leaky ReLU并没有ReLU用的多。

2，除了输出层是一个二元分类问题外，基本不用Sigmoid函数

3，Relu是最常用的默认激活函数，若不确定用哪个激活函数，就使用Relu或者Leaky Relu

转载自作者：LabVIEW_Python
原文链接：https://www.jianshu.com/p/7c57e42e88e8

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。