常用的激活函数总结

最新推荐文章于 2024-02-28 17:57:05 发布

BrotherHappy

最新推荐文章于 2024-02-28 17:57:05 发布

阅读量358

点赞数

分类专栏：深度学习基础知识文章标签： python 深度学习神经网络机器学习算法

本文链接：https://blog.csdn.net/q1540108857/article/details/115216625

版权

深度学习基础知识专栏收录该内容

4 篇文章 0 订阅

订阅专栏

常用的激活函数总结

- - 常用的激活函数的总结

常用的激活函数的总结

1. Sigmoid 函数

$f(z)=\cfrac 1{1+e^{-z}}$
Sigmoid函数的图像

2. tanh函数

$tanh(x)=\cfrac{e^x-e^{-x}}{e^x+e^{-x}}$
左：tanh函数，右：tanh函数的导数

3. ReLU函数

$R e L U = m a x (0, x)$
ReLU函数和其导数图像

ReLU函数可以达到比较快的收敛速度，但是其输出并不是zero-cnetered的，并且有Dead ReLU Problem

ReLU有其变体Leady ReLU

4. ELU(Exponential Linear Uints)函数

$\begin{cases} x,&ifx>0\\ \alpha (e^x-1) &otherwise \end{cases}$
Exponential Linear Uints和其导数

5. MaxOut 函数

函数可以参考论文《maxout networks》Maxout是深度学习的一层网络。

对于网络中的某一层的输入 $X=(x_1,x_2,\cdots x_d)$ ,Maxout隐藏层中每个神经元的计算公式如下：
$KaTeX parse error: Got function '\newline' with no arguments as argument to '\begin{array}' at position 1: \̲n̲e̲w̲l̲i̲n̲e̲$

6.GeLU函数

GeLU是drouout，zoneout,Relu的结合体，GeLU对于输入一个乘以0,1组成 $m a s k$ ,而该 $m a s k$ 的生成则是依据概率随机的依赖输入，假设输入为 $X$ ， $m a s k$ 为 $m$ 那么 $m$ 服从一个伯努利分布( $\Phi(x)=P(X<=x),X\text{服从正态分布}$ ),最终的数学表示如下：
$GeLU(x)=xP(X<=x)=x\Phi(x)\\ 对于标准正太分布，其近似的计算公式为:\\ GeLU(x)=0.5x(1+tanh)\left[\sqrt{2/\pi}(x+0.044715x^3)\right]$

#源码可以如下方式表达：
def gelu(input_tensor):
	cdf = 0.5*(1.0+torch.erf(input_tensor/torch.sqrt(2.0))
	return input_tensor*cdf

7.Mish

$Mish=x*tanh(ln(1+e^x))$

BrotherHappy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
常用的激活函数总结

常用的激活函数总结常用的激活函数的总结1. Sigmoid 函数2. tanh函数3. ReLU函数4. ELU(Exponential Linear Uints)函数5. MaxOut 函数6.GeLU函数常用的激活函数的总结1. Sigmoid 函数f(z)=11+e−zf(z)=\cfrac 1{1+e^{-z}}f(z)=1+e−z12. tanh函数tanh(x)=ex−e−xex+e−xtanh(x)=\cfrac{e^x-e^{-x}}{e^x+e^{-x}}tanh(x
复制链接

扫一扫