深度学习常用激活函数总结

最新推荐文章于 2024-05-19 21:30:48 发布

chen_znn

最新推荐文章于 2024-05-19 21:30:48 发布

阅读量1.1k

点赞数 4

分类专栏：激活函数文章标签：人工智能深度学习激活函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38964360/article/details/131685766

版权

激活函数专栏收录该内容

2 篇文章 0 订阅

订阅专栏

激活函数的特点

非线性。引入非线性能提升模型的表达能力
可微分。如果激活函数不可微，那就无法使用梯度下降方法更新参数
非饱和性。饱和指在某些区间上激活函数的梯度接近于零，使参数无法更新
取值范围有界。这样可以使网络更稳定，即使有很大的输入，激活函数的输出也不会太大
计算简单。复杂的激活函数会降低训练速度

常用激活函数

1、Sigmoid

公式

优点

适用于将预测概率作为输出的模型
梯度平滑
可微

缺点

存在饱和区间，在该区间内，梯度可能会消失
指数运算，计算量较大
函数输出不以零为均值，模型收敛较慢

2、Tanh

公式

优点

解决了非零均值问题

缺点

存在饱和区间，且饱和区间比sigmoid的更大
指数运算，计算量较大

3、ReLU

公式

优点

在正区间解决了梯度消失问题
计算速度快
将小于0的输入置零，从某种程度上防止过拟合

缺点

非零均值
当输入为负时，ReLU完全失效
某些神经元可能永远不会被激活

4、Leaky ReLU

公式

优点

针对Relu函数中存在的Dead Relu Problem，Leaky Relu函数在输入为负值时，给予输入值一个很小的斜率，在解决了负输入情况下的0梯度问题的基础上，也很好的缓解了Dead Relu问题
该函数的输出为负无穷到正无穷，即leaky扩大了Relu函数的范围

缺点

理论上来说，该函数具有比Relu函数更好的效果，但是大量的实践证明，其效果不稳定，故实际中该函数的应用并不多

5、ELU

公式

优点

解决了Dead ReLU Problem问题
该函数在负数域存在饱和区域，从而对噪声具有一定的鲁棒性

缺点

计算量较大
在实践中同样没有较ReLU更突出的效果，故应用不多

6、Softplus

公式

优点

类似于ReLU

缺点

导数小于1，可能存在梯度消失的问题
计算量较大

7、SiLU

公式

优点

继承了ReLU无上界和有下界的特点
相比ReLU又增加了平滑和非单调的特点

缺点

引入了指数函数，增加了计算量

8、ReLU6

公式

出现原因

ReLU6就是把ReLU的最大输出为限制为6（变成有上、下界），这使得模型在移动端设备（dtype=float16/int8，低精度）应用时也能有很好的数值分辨率。如果对ReLU激活范围不加限制，当激活值非常大时，低精度的设备无法很好地描述如此大范围的数值，从而带来精度损失

9、Mish

公式

优点

无上界、有下界
增加了平滑和非单调的特点

缺点

引入了指数函数，增加了计算量

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习常用激活函数总结

本文总结了深度学习常用激活函数
复制链接

扫一扫

专栏目录

chen_znn CSDN认证博客专家 CSDN认证企业博客

码龄7年

198: 原创

1274: 周排名

7985: 总排名

42万+: 访问

: 等级

3672: 积分

3523: 粉丝

1555: 获赞

186: 评论

2128: 收藏

私信

关注

热门文章

分类专栏

python 34篇
transformer 2篇
pytorch 41篇
人脸识别 29篇
Linux系统 23篇
c++ 30篇
ncnn 7篇
opencv 20篇
c语言 3篇
激活函数 2篇
vscode 1篇
目标检测 22篇
caffe 4篇
Android 1篇
anaconda 5篇
nvidia 1篇
模型部署 2篇
损失函数 3篇
注意力机制 2篇
大语言模型 1篇
onnxruntime 1篇
人脸重建 1篇
细粒度图像处理 3篇
数据增强 1篇
目标跟踪 2篇

最新评论

vscode远程ssh连接不稳定的解决方法
Heilyn: 有帮助！
CVPR2024《RMT: Retentive Networks Meet Vision Transformers》论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
np.linalg.norm()
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
AttributeError: module ‘numpy‘ has no attribute ‘float‘.的解决方法
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
配置opencv属性表
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

chen_znn 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。