深度学习——激活函数（函数，函数图像，优缺点，使用建议）

最新推荐文章于 2025-04-10 12:40:16 发布

DeePlaskin

最新推荐文章于 2025-04-10 12:40:16 发布

阅读量9.4k

点赞数 7

分类专栏： tensorflow 文章标签：神经网络深度学习机器学习

本文链接：https://blog.csdn.net/in546/article/details/119621649

版权

tensorflow 专栏收录该内容

24 篇文章

订阅专栏

文章目录

激活函数

激活函数

激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。

激活函数应满足：

非线性：激活函数非线性时，多层神经网络可逼近所有函数。
可微性：优化器大多用梯度下降更新参数。
单调性：当激活函数是单调的，能保证单层网络的损失函数是凸函数。
近似恒等性：当参数初始化为随机小值时，神经网络更稳定。

激活函数输出值的范围：
激活函数输出为有限值时，基于梯度的优化方法更稳定
激活函数输出为无限值时，建议调小学习率
常见的激活函数有：sigmoid，tanh，ReLU，Leaky ReLU，PReLU，RReLU， ELU（Exponential Linear Units），softplus，softsign，softmax等。

sigmoid

在这里插入图片描述

函数图像：

导数图像：

优点：
1、输出映射在(0,1)之间，单调连续，输出范围有限，优化稳定，可用作输出层；
2、求导容易。
缺点：
1、易造成梯度消失；
2、输出非0均值，收敛慢；
3、幂运算复杂，训练时间长。

sigmoid函数可应用在训练过程中。然而，当处理分类问题作出输出时，sigmoid却无能为力。简单地说，sigmoid函数只能处理两个类，不适用于多分类问题。而softmax可以有效解决这个问题，并且softmax函数大都运用在神经网路中的最后一层网络中，使得值得区间在（0,1）之间，而不是二分类的。