1.定义:激活函数是神经网络中引入的非线性函数,用于捕获数据中的复杂关系。
2.激活函数的一般性质:
(1)单调可微
(2)限制输出的范围(输入的数据通过神经网络上的激活函数控制输出数值的大小)
(3)非线性
3.常见的激活函数:
(1)sigmoid
sigmoid是最早使用的激活函数之一,取值范围为(0,1),它可以将一个实数映射到(0,1)的区间,用来做二分类,为每个类输出提供独立的概率。
sigmoid的表达式如下:
![df0cd93725b022dc0560dd95472d2dc3.png](https://i-blog.csdnimg.cn/blog_migrate/ae5a15edabedcc00a7de8827a8350e07.png)
从表达式看出,sigmoid是光滑的、可微的函数。
![bde18e02380df0bc1d0bc9c7305064c0.png](https://i-blog.csdnimg.cn/blog_migrate/b5d707b73d35e106c5d7ab4b7c8e74c8.png)
优点:平滑、易于求导。用于输出层
缺点:激活函数计算量大,反向传播求误差梯度时,求导涉及除法;反向传播时,很容易就会出现梯度消失的情况,从而无法完