激活函数

最新推荐文章于 2017-09-26 09:33:32 发布

yuanyongsama

最新推荐文章于 2017-09-26 09:33:32 发布

阅读量1.8k

点赞数

分类专栏：深度学习基础文章标签：深度学习激活函数神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/justpsss/article/details/77453584

版权

深度学习基础专栏收录该内容

2 篇文章 0 订阅

订阅专栏

ReLU及其扩展

目前，深度学习中最常见的激活函数是 $g(z) = max\{0, z\}$ ，翻译为整流线性单元（rectified linear unit）或者称为ReLU。

“该激活函数是被推荐用于大多数前馈神经网络的默认激活函数。将此函数用于线性变换的输出将产生非线性变换。然而，函数仍然非常接近线性，在这种意义上它是具有两个线性部分的分段线性函数。由于整流线性单元几乎是线性的，因此它们保留了许多使得线性模型易于使用基于梯度的方法进行优化的属性。它们还保留了许多使得线性模型能够泛化良好的属性。计算机科学的一个公共原则是，我们可以从最小的组件构建复杂的系统。就像图灵机的内存只需要能够存储0 或1 的状态，我们可以从整流线性函数构建一个万能函数近似器。”

以上摘抄自Goodfellow的《深度学习》一书。

ReLU实际上是两段线性函数，当处于激活状态时，它的导数处处为1，保持比较大；但是其在另一半定义域上恒为0，不能通过梯度进行学习。因而有了一些ReLU的扩展函数。

主要有三个：

α i : h i = g (z, α) i = m a x (0, z i) + α i m i n (0, z i)

$\alpha_i:h_i=g(z,\alpha)_i=max(0,z_i)+\alpha_imin(0,z_i)$

绝对值整流：固定 $\alpha_i=-1$ 使得 $g(z)=|z|$ ；

渗漏整流线性单元(Leaky ReLu)：将 $\alpha_i$ 固定为类似0.01的小值；

参数化整流线性单元(PReLu)：将 $\alpha_i$ 作为学习的参数。

sigmoid和tanh

在引入ReLU之前，常用的激活函数是logistic sigmoid函数：

g (x) = σ (z) = 1 1 + e - z

$g(x)=\sigma(z)=\frac{1}{1+e^{-z}}$

导数为： $g'(z)=g(z)(1-g(z))$

或者双曲正切函数：

g (z) = t a n h (z) = 2 1 + e - 2 z - 1

$g(z)=tanh(z)=\frac{2}{1+e^{-2z}}-1$

导数为： $g'(z)=1-g(z)^2$

这两个激活函数紧密相关，因为 $tanh(z)=2\sigma(2z)-1$ 。

当必须要使用sigmoid函数时，tanh函数通常表现的更好，因为tanh更像单位函数，尤其是在0附近时，只要网络的激活能够被保持地很小，训练tanh网络更加容易。

但是这两个函数的广泛饱和性使得基于梯度的学习变得比较困难，一般在CNN中已经很少使用了。

当然还有一些其他的激活函数，比如softplus等，但是如果它们的表现仅仅是跟ReLU大致相当，而不能表现的比ReLU好很多的话，是不会引起其他人的兴趣的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
激活函数

ReLU及其扩展目前，深度学习中最常见的激活函数是g(z)=max{0,z}g(z) = max\{0, z\} ，翻译为整流线性单元（rectified linear unit）或者称为ReLU。“该激活函数是被推荐用于大多数前馈神经网络的默认激活函数。将此函数用于线性变换的输出将产生非线性变换。然而，函数仍然非常接近线性，在这种意义上它是具有两个线性部分的分段线性函数。由于整流线性单元几乎是线性
复制链接

扫一扫

专栏目录

yuanyongsama CSDN认证博客专家 CSDN认证企业博客

码龄12年

5: 原创

55万+: 周排名

125万+: 总排名

3万+: 访问

: 等级

289: 积分

10: 粉丝

26: 获赞

7: 评论

63: 收藏

私信

关注

热门文章

分类专栏

最新评论

FCN和U-Net
清清浅浅g: 关于 U-Net 论文图里没有 Padding 的坑我也遇到过，还在组会上哑口无言哈哈哈哈
FCN和U-Net
Hsaki 回复聪仔1234: FCN最后输出21个channel，而unet最后只输出2个channel
FCN和U-Net
邪恶泰迪: 博主说的很好，但是有一点好像说的有些不对，fcn 卷积后的图是heatmap，然后heatmap再上采样变成和原图大小一样，热图是卷积后的小图。
FCN和U-Net
聪仔1234: 作者您好，想跟您探讨下为什么ＦＣＮ可以最后分为许多类　　Ｕｎｅｔ只能是二分类我的扣扣是710694640 望赐教
FCN和U-Net
EricaZZ: 感谢作者，总结的非常好，解了我很多疑惑，也加深了理解。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。