什么是激活函数，常用的激活函数有哪些？

七魔心

已于 2024-10-05 17:42:29 修改

阅读量202

点赞数 3

分类专栏：深度学习在金融领域的应用文章标签：金融学习

于 2024-10-05 16:26:38 首次发布

本文链接：https://blog.csdn.net/qq_24766857/article/details/142715757

版权

深度学习在金融领域的应用专栏收录该内容

12 篇文章 0 订阅

订阅专栏

在这里插入图片描述

激活函数在神经网络中扮演着关键角色，它们对每个神经元的输入进行非线性变换，从而允许网络学习和表示数据中的复杂模式。如果神经网络仅使用线性变换，那么无论网络有多少层，它都只能学习到输入与输出之间的线性关系。而大多数现实世界的问题，特别是像金融时间序列这样的问题，涉及复杂的、非线性的关系，因此激活函数是必不可少的。

常用的激活函数

Sigmoid 函数
- 数学表达式: ( f(x) = \frac{1}{1 + e^{-x}} )
- 特点:
  - 输出范围在 (0, 1) 之间。
  - 适合用于二分类问题或作为阶跃函数的平滑近似。
  - 是一个光滑且可微的函数，有助于基于梯度的优化算法。
- 缺点:
  - 当输入值很大或很小时，梯度接近于零，这可能导致梯度消失问题。
  - 不是以零为中心，可能影响网络收敛速度。
ReLU (Rectified Linear Unit) 函数
- 数学表达式: ( f(x) = \max(0, x) )
- 特点:
  - 计算简单，加快了计算和训练过程。
  - 有助于缓解深度网络中的梯度消失问题。
- 缺点:
  - 对于负数输入输出为零，可能导致“死”神经元现象。
  - 在 x=0 处不平滑，可能会造成优化困难。
Leaky ReLU 函数
- 数学表达式: ( f(x) = \max(0.01x, x) ) （斜率可以调整）
- 特点:
  - 解决了标准 ReLU 的“死”神经元问题，对于负数输入也能产生非零响应。
  - 是一个连续函数，即使对于负数输入也有定义良好的导数。
- 缺点:
  - 负数部分的斜率是一个超参数，需要仔细调整。
  - 相比其他激活函数如 tanh 和 sigmoid，它提供的负激活程度较低。
Tanh (双曲正切) 函数
- 数学表达式: ( f(x) = \tanh(x) = \frac{e^x - e^{-x}}{ex + e^{-x}} )
- 特点:
  - 输出范围在 (-1, 1) 之间。
  - 以零为中心，有利于网络的学习。
- 缺点:
  - 类似于 Sigmoid 函数，当输入绝对值较大时，梯度会趋近于零。
Softmax 函数
- 通常用于多分类问题的最后一层，将多个输出转换成概率分布。
- 确保所有输出之和为1，适用于分类任务。