深度学习中常见的激活函数

托比-马奎尔

于 2024-08-21 21:10:56 发布

阅读量171

点赞数 2

分类专栏：深度学习基础知识文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47896523/article/details/141402940

版权

深度学习基础知识专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1. Sigmoid函数

$\sigma (x) = \frac{1}{1+e^{-x}}$

范围：输出值在0到1之间。
导数： $\sigma'(x) = \sigma(x) \cdot (1 - \sigma(x))$
优点：简单直观，适用于二分类问题的输出层。
缺点：在输入值较大或较小时，梯度会变得非常小（梯度消失），这会导致深层网络训练困难。同时，Sigmoid函数的输出不是以0为中心的，这可能会导致梯度下降过程中的不稳定。

应用场景：常用于二分类问题的输出层，早期的全连接层中也会使用。

2. Tanh（双曲正切函数）

$tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$

范围：输出值在-1到1之间。
导数： $\tanh'(x) = 1 - \tanh^2(x)$
优点：相比Sigmoid，tanh函数的输出以0为中心，这有助于梯度的传播。对于输入值较小或较大的情况，梯度的消失问题相对较轻。
缺点：当输入值非常大或非常小时，tanh函数的梯度仍然会接近于零（梯度消失）。

应用场景：适用于中间层的激活函数，尤其是在需要负值和正值的情况中。

3. ReLU()激活函数

$ReLU(x)=max(0,x)$

范围：输出值在0到正无穷之间。
导数： $\text{ReLU}'(x) = \begin{cases} 0 & \text{if } x \leq 0 \\ 1 & \text{if } x > 0 \end{cases}$
优点：计算简单，梯度计算效率高，减少了梯度消失的问题，有助于加速网络的收敛。
缺点：可能导致“死亡神经元”问题，即大量神经元输出恒为0，无法进行有效的训练。

应用场景：广泛应用于隐藏层的激活函数，是现代深度学习模型中的默认选择。

托比-马奎尔

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习中常见的激活函数

深度学习中常用的激活函数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。