常见激活函数
阶跃型函数
s g n sgn sgn函数
s g n sgn sgn函数定义为:
s g n ( x ) = { 1 , x ≥ 0 ; 0 , x < 0. sgn(x) = \begin{cases} 1, & x \geq 0; \\ 0, & x< 0. \end{cases} sgn(x)={
1,0,x≥0;x<0.
s g n ( x ) sgn(x) sgn(x)通过将输入转换为输出值 0 0 0和 1 1 1,来表示神经元的抑制( 0 0 0)和兴奋( 1 1 1)。
然而,由于 s g n ( x ) sgn(x) sgn(x)具有不连续、不光滑等不太好的性质,因此实际常用 S i g m o i d Sigmoid Sigmoid型函数做为激活函数。
S i g m o i d Sigmoid Sigmoid型函数
S i g m o i d Sigmoid Sigmoid型函数是指一类 S S S型曲线函数,为两端饱和函数。常用的 S i g m o i d Sigmoid Sigmoid型函数有 L o g i s t i c Logistic Logistic函数和 T a n h Tanh Tanh函数。
饱和
对于函数 f ( x ) f(x) f(x),若 x → − ∞ x \rightarrow -\infty x→−∞时,其导数 f ′ ( x ) → 0 f^\prime(x) \rightarrow 0 f′(x)→0,则称其为左饱和。
若 x → + ∞ x \rightarrow +\infty x→+∞时,其导数 f ′ ( x ) → 0 f^\prime(x) \rightarrow 0 f′(x)→0,则称其为右饱和。
当同时满足左、右饱和时,就称为两端饱和。
L o g i s t i c Logistic Logistic函数
L o g i s t i c Logistic Logistic函数定义为:
σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1+e^{-x}} σ(x)=1+e−x1
L o g i s t i c Logistic Logistic函数将输入映射为区间 ( 0 , 1 ) (0,1) (0,1)之间的输出值,当输入值在 0 0 0附近时, S i g m o i d Sigmoid Sigmoid型函数近似为线性函数;当输入值靠近两端时,对输入进行抑制。输入越小,越接近于0;输入越大,越接近于1。这样的特点也和生物神经元类似,对一些输入会产生兴奋(输出为1),对另一些输入产生抑制(输出为0)。和感知器使用的阶跃激活函数相比, L o g i s t i c Logistic Logistic函数是连续可导的,其数学性质更好。
函数图如下:
T a n h Tanh Tanh函数
T a n h Tanh Tanh函数定义为:
t a n h ( x ) = e x − e − x e x + e − x tanh(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}} tanh(x)=ex+e−xex−e−x
T a n h ( x ) Tanh(x) Tanh(x)函数将输入映射为区间 ( − 1 , 1 ) (-1,1) (−1,1)上的输出值,可以看作是放大并平移的 L o g i s t i c Logistic Logistic函数: