激活函数relu、leaky-relu、elu、selu、serlu比较

最新推荐文章于 2024-05-18 13:21:49 发布

小岚的学习笔记

最新推荐文章于 2024-05-18 13:21:49 发布

阅读量1w

点赞数 7

分类专栏：学习笔记文章标签：机器学习深度学习激活函数人工智能

本文链接：https://blog.csdn.net/littlelanlan/article/details/98497360

版权

什么是激活函数

简单来说我们知道神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值，并将输入值传递给下一层，输入层神经元节点会将输入属性值直接传递给下一层（隐层或输出层）。在多层神经网络中，上层节点的输出和下层节点的输入之间具有一个函数关系，这个函数称为激活函数。
如果不用激活函数（其实相当于激活函数是f(x) = x），在这种情况下你每一层节点的输入都是上层输出的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与没有隐藏层效果相当，这种情况就是最原始的感知机（Perceptron）了，那么网络的逼近能力就相当有限。因此引入非线性函数作为激活函数，这样深层神经网络表达能力就更加强大。

1.ReLU(Rectified Linear Unit)

函数形式：
$ReLU(x)=\left\{ \begin{array}{ll} x & \textrm{x $\ge$ 0}\\ 0 & \textrm{otherwise}\\ \end{array} \right.$
感觉是最常用的激活函数，形式简单，高度非线性。
优点：高度非线性。加快收敛速度，缓解梯度消失、爆炸问题，简化计算。
缺点：因为其将所有的输入负数变为0，在训练中可能很脆弱，很容易导致神经元失活，使其不会在任何数据点上再次激活。对于ReLu中(x<0)的激活，此时梯度为0，因此在下降过程中权重不会被调整。

2.Leaky-ReLU

函数形式：
$LReLU(x)=\left\{ \begin{array}{ll} x & \textrm{x $\ge$ 0}\\ ax & \textrm{otherwise}\\ \end{array} \right.$

最低0.47元/天解锁文章

小岚的学习笔记

关注

7
点赞
踩
48

收藏

觉得还不错? 一键收藏
1
评论
激活函数relu、leaky-relu、elu、selu、serlu比较

1.ReLU(Rectified Linear Unit)函数形式：ReLU(x)={xx ≥ 00otherwiseReLU(x)=\left\{ \begin{array}{ll}x &amp; \textrm{x $\ge$ 0}\\0 &amp; \textrm{otherwise}\\\end{array}\right.ReLU(x)=...
复制链接

扫一扫