激活函数种类与区别

最新推荐文章于 2023-04-19 14:21:10 发布

zkq_1986

最新推荐文章于 2023-04-19 14:21:10 发布

阅读量1.3k

点赞数

分类专栏：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zkq_1986/article/details/71124036

版权

神经网络专栏收录该内容

65 篇文章 3 订阅

订阅专栏

1 激活函数类别

（1）tanh（/ˈtænʃ/）

双曲正切 tanh=sinh/cosh=(ex-e-x)/(ex+e-x)

（2）sigmoid

f(x)=1/(1+e-(wx+b))

（3）Relu(读re路)

rectified linear unit (ReLU)

f(x)=max(0,x)

2 sigmoid、tanh与Relu区别

（1）sigmoid函数。这是传统神经网络中最常用的激活函数之一（另一个是tanh），对应的图像如图所示。

sigmoid函数的优点在于，它的输出映射在(0,1)内，单调连续，非常适合用作输出层，并且求导比较容易。但是，它也有缺点，因为软饱和性 [15] ，一旦输入落入饱和区，f ' (x )就会变得接近于0，很容易产生梯度消失。

（2）tanh函数。对应的图像如图所示。

tanh函数也具有软饱和性。因为它的输出以0为中心，收敛速度比sigmoid要快。但是仍无法解决梯度消失的问题。

（3）relu函数是目前最受欢迎的激活函数。softplus可以看作是ReLU的平滑版本。relu定义为f (x )=max(x ,0)。softplus定义为f (x )=log(1+exp(x ))。

由图可见，relu在x <0时硬饱和。由于x >0时导数为1，所以，relu能够在x >0时保持梯度不衰减，从而缓解梯度消失问题，还能够更快地收敛，并提供了神经网络的稀疏表达能力。但是，随着训练的进行，部分输入会落到硬饱和区，导致对应的权重无法更新，称为“神经元死亡”。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。