激活函数汇总

Thomas_Cai

已于 2024-07-18 17:46:53 修改

阅读量834

点赞数 20

分类专栏：深度学习文章标签：深度学习激活函数训练炼丹机器学习

于 2024-07-18 17:32:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ThomasCai001/article/details/140526546

版权

深度学习专栏收录该内容

79 篇文章

订阅专栏

在这里插入图片描述

文章目录

以下是常用的激活函数总结

1. ReLU (Rectified Linear Unit) (2010年)

函数：
优点：
- 简单易实现，计算效率高。
- 在正值区域梯度不会消失，有助于缓解梯度消失问题。
缺点：
- 当输入为负时，梯度为零，导致神经元可能会“死亡”，即永远不会被激活。
使用场景：
- 广泛用于多层感知机、卷积神经网络等深度学习模型中。

2. Leaky ReLU (2013年)

函数：

其中， $\alpha$ 是一个小于1的常数（例如0.01）。
优点：
- 解决了ReLU的“死亡神经元”问题。
缺点：
- 仍然存在非零的负值区域，可能对某些任务不够理想。
使用场景：
- 深度神经网络中代替ReLU，尤其是在处理稀疏输入时。

3. ELU (Exponential Linear Unit) (2015年)

函数：

在这里插入图片描述
其中， $\alpha$ 通常为1。

优点：
- 保持非负激活值，有助于梯度流动。
缺点：
- 计算复杂度高于ReLU。
使用场景：
- 深度神经网络中的隐藏层。

4. GELU (Gaussian Error Linear Unit) (2016年)

函数：

在这里插入图片描述

在这里插入图片描述

优点：
- 表现出更好的学习能力和稳健性，尤其在Transformer模型中。
缺点：
- 计算复杂度高于ReLU和Leaky ReLU。
使用场景：
- Transformer模型、BERT等大型预训练模型中。

5. SELU (Scaled Exponential Linear Unit) (2017年)

函数：

在这里插入图片描述
其中， $\lambda$ 和 $\alpha$ 是定值，通常为 $\lambda \approx 1.0507$ 和 $\alpha \approx 1.6733$ 。

优点：
- 自归一化特性，有助于保持网络中的激活值在一定范围内。
缺点：
- 对输入数据有一定要求，通常需要中心化和标准化处理。
使用场景：
- 自归一化神经网络（Self-Normalizing Neural Networks, SNNs）中。

6. SiLU (Sigmoid Linear Unit) / Swish (2017年)

函数：
优点：
- 平滑且连续可导，有助于梯度流动。
- 在某些任务中表现优于ReLU。
缺点：
- 计算复杂度高于ReLU。
使用场景：
- 图像分类、自然语言处理等任务中。

7. Tanh (Hyperbolic Tangent)

函数：

在这里插入图片描述

优点：
- 输出值在-1和1之间，对称性较好。
缺点：
- 仍然可能导致梯度消失问题。
使用场景：
- 隐藏层中的激活函数。

8. Sigmoid

函数：

在这里插入图片描述

优点：
- 输出值在0和1之间，适用于二分类问题。
缺点：
- 容易导致梯度消失问题。
使用场景：
- 输出层用于二分类问题。

9. Softmax

函数：

在这里插入图片描述

优点：
- 输出值为概率分布，适用于多分类问题。
缺点：
- 计算复杂度高。
使用场景：
- 输出层用于多分类问题。

Enjoy~

$_{One\ person\ go\ faster,\ a\ group\ of\ people\ can\ go\ further}\sim$

博客等级

码龄9年

160
原创

1124
点赞

1625
收藏

770
粉丝

关注

私信

热门文章

分类专栏

最新评论

优化Langchain-Chatchat数据库对话功能
Thomas_Cai: hh 不客气这个很关键不然校验很容易不过
优化Langchain-Chatchat数据库对话功能
Mr Just do it!: [code=python] # 打印原始SQL命令 print("===== 原始SQL命令 =====") print(sql_cmd) # 提取SQL语句 if "```sql" in sql_cmd: sql_cmd = sql_cmd.split("```sql")[1].split("```")[0].strip() elif "```" in sql_cmd: sql_cmd = sql_cmd.split("```")[1].strip() # 打印处理后的SQL命令 print("===== 处理后SQL命令 =====") print(sql_cmd) [/code] 这段代码救我狗命
优化Langchain-Chatchat数据库对话功能
Mr Just do it!: 感谢博主： # 打印原始SQL命令 print("===== 原始SQL命令 =====") print(sql_cmd) # 提取SQL语句 if "```sql" in sql_cmd: sql_cmd = sql_cmd.split("```sql")[1].split("```")[0].strip() elif "```" in sql_cmd: sql_cmd = sql_cmd.split("```")[1].strip() # 打印处理后的SQL命令 print("===== 处理后SQL命令 =====") print(sql_cmd)
自动数据增广论文笔记 | AutoAugment: Learning Augmentation Strategies from Data
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Nvidia驱动莫名其妙不好使了？nvidia-smi报错？如何解决？已解决！！
Thomas_Cai: 客气

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Thomas_Cai 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。