激活函数

最新推荐文章于 2024-06-07 10:42:49 发布

安悦

最新推荐文章于 2024-06-07 10:42:49 发布

阅读量168

点赞数

分类专栏：深度学习文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/weixin_40620694/article/details/106361374

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

激活函数

Sigmoid

$\sigma(x)=\dfrac{1}{1+e^{-x}}$

导数

$\sigma'(x)=(1-\sigma(x))\sigma(x)$

优点

将数值压缩到 $(0, 1)$ 之间
曲线平滑，便于求导

缺点

容易饱和输出，导致回传梯度消失，参数无法更新
不是零均值， $w_i$ 的梯度都是正数或者负数，梯度“之字形”更新，收敛满
exp函数计算复杂度高

tanh

$tanh(x)=\dfrac{e^x-e^{-x}}{e^x+e^{-x}}$

优点

将数值压缩到 $(- 1, 1)$ 之间
zero-centered
曲线平滑，便于求导

缺点

容易饱和输出
exp计算复杂度高

ReLU

$f (x) = m a x (0, x)$

优点

在正区间不会饱和
计算复杂度极低
收敛速度比sigmoid和tanh快

缺点

不是零均值
不压缩数据，数据幅度会随着网络加深不断增大
神经元坏死（Dead ReLU）（采用合适的参数初始化和调整学习率可以缓解这种现象）

Leaky ReLU

$f (x) = m a x (0.01 x, x)$

优点

不会造成饱和
计算复杂度低
收敛速度比Sigmoid和tanh快
近似零均值
解决ReLU的神经元坏死问题

缺点

数值幅度不断增大
实际表现不一定比ReLU好

ELU (Exponential Linear Units)

$f(x)=\begin{cases} x&\\ \alpha(exp(x)-1)&x\le0 \end{cases}$

优点

不会造成饱和
收敛速度比Sigmoid和tanh快
近似零均值
解决ReLU的神经元坏死问题

缺点

exp计算复杂度高
实际表现不一定比ReLU好

激活函数的选择

首选ReLU，但是要注意初始化和学习率设置
不要使用Sigmoid
可以使用tanh，不过效果一般不太好
其他激活函数可以尝试

安悦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
激活函数

激活函数Sigmoidσ(x)=11+e−x\sigma(x)=\dfrac{1}{1+e^{-x}}σ(x)=1+e−x1导数σ′(x)=(1−σ(x))σ(x)\sigma'(x)=(1-\sigma(x))\sigma(x)σ′(x)=(1−σ(x))σ(x)优点将数值压缩到(0,1)(0,1)(0,1)之间曲线平滑，便于求导缺点容易饱和输出，导致回传梯度消失，参数无法更新不是零均值，wiw_iwi的梯度都是正数或者负数，梯度“之字形”更新，收敛满exp函数计算
复制链接

扫一扫

专栏目录