在神经网络中,常用到的激活函数有sigmoid函数
,双曲正切(hyperbolic tangent)函数f(x) = tanh(x)。
![](https://i-blog.csdnimg.cn/blog_migrate/043e7a4a1bceb045c86228c196e9293f.png)
今天要说的是另外一种activation function,rectified linear function
![](https://i-blog.csdnimg.cn/blog_migrate/23ce4f8b88cfa6398fcc4a763f08a6df.png)
线性整流函数(Rectified Linear Unit, ReLU),又称修正线性单元, 是一种人工神经网络中常用的激活函数(activation function),通常指代以斜坡函数及其变种为代表的非线性函数。
比较常用的线性整流函数有斜坡函数 f(x) = max(0, x),以及带泄露整流函数 (Leaky ReLU),其中为x神经元(Neuron)的输入。线性整流被认为有一定的生物学原理,并且由于在实践中通常有着比其他常用激活函数(譬如逻辑函数)更好的效果,而被如今的深度神经网络广泛使用于诸如图像识别等计算机视觉人工智能领域。
在神经网络中,线性整流函数作为神经元的激活函数,定义了该神经元在线性变换
之后的的非线性输出结果。换言之,对于进入神经元的来自上一层神经网络的输入向量
,使用线性整流激活函数的神经元会输出
至下一层神经元或作为整个神经网络的输出(取决现神经元在网络结构中所处位置)。
线性整流函数在基于
斜坡函数
的基础上有其他同样被广泛应用于深度学习的变种,譬如带泄露线性整流(Leaky ReLU)
, 带泄露随机线性整流(Randomized Leaky ReLU)
,以及噪声线性整流(Noisy ReLU)
。
![](https://gss0.bdstatic.com/-4o3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D55/sign=9f62fb0bc6fc1e17f9bf8c344b90a9af/b7003af33a87e950e9e1bf7119385343fbf2b43d.jpg)
![](https://gss1.bdstatic.com/-vo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D9/sign=055a4eb60a3b5bb5bad72cce36abef/bd3eb13533fa828b8b70d2fef41f4134970a5a5f.jpg)
![](https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D112/sign=d8a618f4fbd3572c62e298ddb8126352/d52a2834349b033b89c2b3c71cce36d3d539bd61.jpg)
带泄露线性整流
在输入值
为负的时候,
带泄露线性整流函数(Leaky ReLU)的梯度为一个常数
而不是0。在输入值为正的时候,带泄露线性整流函数和普通斜坡函数保持一致。
![](https://gss2.bdstatic.com/9fo3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D9/sign=7b6cb7c27f094b36df9217dca38c1a/fd039245d688d43fcd55d8ef741ed21b0ef43b2a.jpg)
![](https://gss0.bdstatic.com/94o3dSag_xI4khGkpoWK1HF6hhy/baike/s%3D62/sign=cfea73094ba7d933bba8e771ad4b4135/7acb0a46f21fbe09ab3a8a0962600c338744ad43.jpg)
![](https://i-blog.csdnimg.cn/blog_migrate/9a505872f118206b33d7e2c8635ad3e9.png)
带参数线性整流
![](https://i-blog.csdnimg.cn/blog_migrate/e24f481a89850549cdf290619bff1942.png)
References:https://en.wikipedia.org/wiki/Rectifier_(neural_networks)