神经网络中的激活函数——tanh函数

机器学习初学者Jason

于 2024-05-15 15:43:40 发布

阅读量3.6k

点赞数 10

文章标签：神经网络机器学习人工智能

本文链接：https://blog.csdn.net/Seu_Jason/article/details/138910958

版权

tanh（双曲正切）函数是一种常用的激活函数，它是Sigmoid函数的变种。tanh函数将输入值映射到范围在-1到1之间的连续值。其数学表达式为：

$\tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$

tanh函数的图像呈S形曲线，类似于Sigmoid函数，但tanh函数的输出范围是在-1到1之间。以下是tanh函数的图像示例：

tanh函数在神经网络中有许多应用场景，主要是作为隐藏层的激活函数。以下是一些常见的应用场景：

神经网络隐藏层的激活函数：在深度神经网络中，tanh函数通常被用作隐藏层的激活函数。它的输出范围在-1到1之间，相比于Sigmoid函数，在表示能力上更加强大，因为它的输出有零中心性质，有助于减少梯度消失问题。
特征缩放：tanh函数将输入数据映射到范围在-1到1之间，可以用于对输入数据进行标准化和特征缩放。这有助于加速神经网络的训练过程，提高模型的性能。
序列数据建模：在处理序列数据（如时间序列、自然语言文本等）时，tanh函数常被用于循环神经网络（RNN）的隐藏层，以捕捉序列数据之间的复杂关系。
图像处理：在某些图像处理任务中，tanh函数可以作为一种激活函数来帮助提取图像的特征和进行图像分类。
生成模型：在一些生成模型中，如生成对抗网络（GAN）中的生成器部分，tanh函数可以用于生成网络的输出层，将生成的图像像素值映射到合适的范围内。