CNN笔记(3)---激活函数

最新推荐文章于 2024-09-03 16:59:05 发布

Codename-NC

最新推荐文章于 2024-09-03 16:59:05 发布

阅读量1.6k

点赞数

分类专栏：笔记-算法文章标签： CNN 激活函数

本文链接：https://blog.csdn.net/ericcchen/article/details/80102006

版权

17 篇文章

订阅专栏

σ (x) = 1 1 + e ( - x )

$\sigma(x)=\frac{1}{1+e^{(-x)}}$

sigmoid 将输出响应的值域压缩到[0,1]之间

但是，两端大于5，小于-5的区域，梯度接近0，带来梯度的“饱和效应”

反向传播中无法传递误差

而且sigmoid 的值域均值并非为0，而是全为正

为解决均值问题

t a n h (x) = 2 σ (2 x) - 1

$tanh(x) = 2\sigma(2x)-1$

双曲正切函数

函数范围（-1,1）

输出响应均值为0

仍有梯度饱和线性

R e L U (x) = m a x {0, x}

$ReLU(x)=max\{0,x\}$

优点：
- x>=0时，梯度为1，消除了梯度饱效应
- 有助于随机梯度下降方法收敛，收敛更快

缺点：
- x<0时，梯度为0，“死区”

将ReLU函数中x<0部分调整为 $f(x)=\alpha x$

$\alpha$ 为0.01/ 0.001数量级的较小正数

$\alpha$ 为超参数，不好取值，实际性能不稳定

直接将 $\alpha$ 作为一个网络中可学习的变量融入训练

使用误差反向传播，SGD,更新遵循链式法则

$\alpha$ 取值在训练阶段服从均匀分布，在测试阶段，将其指定为该均匀分布对应的分布期望 $\frac{l+u}{2}$

R a n d o m i z e d R e L U (x) = {x, α, x, i f i f x > = 0 x < 0

$Randomized ReLU(x) = \left\{ \begin{aligned} x,&&if && x>=0 \\ \alpha^, x, &&if&& x<0 \end{aligned} \right.$

其中，

α, \sim U (l, u), a n d l . u \in [0, 1)

$\alpha^{,} \sim U(l,u),and \space l.u \in [0,1)$

R a n d o m i z e d R e L U (x) = {x, λ (e x - 1), i f i f x > = 0 x < 0

$Randomized ReLU(x) = \left\{ \begin{aligned} x,&&if && x>=0 \\ \lambda (e^x-1), &&if&& x<0 \end{aligned} \right.$

ELU 解决了ReLU 函数自身的“死区”问题。
不过，ELU函数中的指数操作稍稍增大了计算量。
实际使用中，ELU 中的超参数 λ 一般设置为 1。

参考文献：解析卷积神经网络—深度学习实践手册