FTS:Flatten-T Swish 激活函数

皮鼓坐凳子

已于 2022-06-25 01:03:31 修改

阅读量175

点赞数 1

分类专栏：激活函数大全文章标签：人工智能深度学习机器学习

于 2022-06-24 21:10:43 首次发布

本文链接：https://blog.csdn.net/weixin_38190702/article/details/125443394

版权

激活函数大全专栏收录该内容

32 篇文章 0 订阅

订阅专栏

FTS: Flatten-T Swish : a thresholded ReLU-Swish-like activation function for deep learning

文章链接：[ FTS: Flatten-T Swish : a thresholded ReLU-Swish-like activation function for deep learning]
年份：2018年

介绍：

ReLU激活函数是深度学习在CNN中的默认激活函数，但是负输入时，0输出，严重负值通过网络传播。该文章提出了一个称为扁平化Swish的激活函数(Flatten-T Swish(FTS))。通过简单的试验发现分类的准确率有所提高，而且FTS的收敛速度是ReLU的两倍。

方法：

FTS包含了ReLU和Swish的相似属性，并且附加了阈值T参数，可以提高分类精度。首先将原始的ReLU的线性恒等部分与Sigmoid激活函数进行修正，具体可以简单的表达为：
$ReLU(x)\cdot Sigmoid(x) = \begin{cases} \frac{x}{1+e^{-x}} & x\ge 0\\ 0 & x<0 \end{cases}$
可以发现 $x\ge 0$ 区域FTS与Swish具有相似的性质；FTS在负区域保留了与ReLU相同的强制为零的特性，这样减少了计算的复杂度，增加了稀疏性。FTS的对x的导数为：
$FTS^\prime(x)= \begin{cases} \frac{1+e^{-x}+e^{-x}x}{(1+e^{-x})^2} & x\ge 0\\ 0 & x<0 \end{cases}$
FTS具体的函数图像如下图所示：
FTS的函数曲线和导数曲线
当前FTS仍然存在负神经元死亡问题，由此添加一个参数T，将阈值T设置为小于零的值，用以保证网络在负值时仍可以进行反向传播，具体的公式为：
$\begin{cases} \frac{x}{1+e^{-x}} +T& x\ge 0\\ T & x<0\end{cases}$
加入参数后的FTS(x)的导数为：
$FTS^\prime(x)= \begin{cases} \frac{1+e^{-x}+e^{-x}x}{(1+e^{-x})^2} & x\ge 0\\ 0 & x<0 \end{cases}$
加入参数T后的函数曲线如下图：
加入参数T后的函数导数曲线
通过试验表明当 $T = - 0.2$ 时的FTS由于其它激活函数。而且FTS的收敛速度比ReLU快两倍。但是FTS没有解决负值神经元死亡问题。