深度学习（七）激活函数

最新推荐文章于 2022-11-19 15:58:56 发布

木木歹朱

最新推荐文章于 2022-11-19 15:58:56 发布

阅读量182

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35319215/article/details/99711626

版权

一、Sigmoid函数

优点：

能够把输入的连续实值变换为0和1之间的输出。

缺点：

容易梯度消失
输出不是0均值，不便于下层的计算
含有幂运算，求解耗时。

为什么要0均值？

二、tanh函数

解决了Sigmoid函数的不是zero-centered输出问题
梯度消失和幂运算的问题仍然存在。

三、Relu函数

优点：

解决了梯度消失问题
计算速度非常快，只需要判断输入是否大于0
收敛速度远快于sigmoid和tanh

缺点：

ReLU的输出不是0均值
Dead ReLU Problem，某些神经元可能永远不会被激活，导致相应的参数永远不能被更新。

有两个主要原因可能导致这种情况产生

非常不幸的参数初始化，这种情况比较少见
learning rate太高导致在训练过程中参数更新太大，不幸使网络进入这种状态。解决方法是可以采用Xavier初始化方法，以及避免将learning rate设置太大或使用adagrad等自动调节learning rate的算法。

四、Leaky Relu

解决了ReLU函数在输入为负的情况下产生的梯度消失问题。

五、Elu

六、PRelu

参数化修正线性单元
当参数取的比较大，Leaky Relu就是PRelu

七、RReLU

是在一个给定的范围内随机抽取的值，这个值在测试环节就会固定下来。

参考资料

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习（七）激活函数

一、Sigmoid函数优点：能够把输入的连续实值变换为0和1之间的输出。缺点：容易梯度消失输出不是0均值，不便于下层的计算含有幂运算，求解耗时。为什么要0均值？二、tanh函数解决了Sigmoid函数的不是zero-centered输出问题梯度消失和...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。