常见激活函数整理

最新推荐文章于 2024-09-07 14:46:01 发布

AI-Candy

最新推荐文章于 2024-09-07 14:46:01 发布

阅读量317

点赞数

分类专栏： AI 文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/ys_1991/article/details/88550875

版权

AI 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

一.什么是激活特征函数
1.激活函数是我们对输入做的一种非线性的转换。转换的结果输出，并当作下一个隐藏层的输入
2.当没有激活函数的时候，神经元对数据的处理就是基于权重和偏移做线性变换。线性变换很简单，但是限制了对复杂任务的处理能力。没有激活函数的神经网络就是一个线性回归模型。激活函数做的非线性变换可以使得神经网络处理非常复杂的任务
3.常见的激活函数的对比
[1]sigmoid
激活函数计算量大，反向传播求误差梯度时，求导涉及除法
反向传播时，很容易就会出现梯度消失的情况，从而无法完成深层网络的训练（sigmoid的饱和性）
sigmoid函数的输出均大于0，使得输出不是0均值，这称为偏移现象，这会导致后一层的神经元将得到上一层输出的非0均值的信号作为输入
[2]tanh
取值范围为[-1,1]。
tanh在特征相差明显时的效果会很好，在循环过程中会不断扩大特征效果。
与 sigmoid 的区别是，tanh 是 0 均值的，因此实际应用中 tanh 会比 sigmoid 更好，然而，tanh一样具有软饱和性，从而造成梯度消失
[3]relu
ReLU 的优点：
除此之外，当x<0时，ReLU硬饱和，而当x>0时，则不存在饱和问题。所以，ReLU 能够在x>0时保持梯度不衰减，从而缓解梯度消失问题。
ReLU 的缺点：
随着训练的推进，部分输入会落入硬饱和区，导致对应权重无法更新。这种现象被称为“神经元死亡”。与sigmoid类似，ReLU的输出均值也大于0，偏移现象和神经元死亡会共同影响网络的收敛性。

激活函数