激活函数（Activation function）

最新推荐文章于 2023-05-13 20:23:36 发布

Tiger-Li

最新推荐文章于 2023-05-13 20:23:36 发布

阅读量989

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

112 篇文章 25 订阅

订阅专栏

激活函数（Activation function）

神经网络中使用激活函数来加入非线性因素，提高模型的表达能力。

ReLU(Rectified Linear Unit,修正线性单元)

f (x) = {0, x, x \leq 0 x > 0

详细公式 ReLU:

f (x) 其 中 σ (z) = \sum i = 1 inf σ (x - i + 0.5) \approx log (1 + e x) \approx max (0, x + N (0, 1)) = 1 1 + e - x (stepped sigmoid) (softplus function) (ReL function) (sigmoid) (1) (2) (3) (4)

ReLU变种

Leaky ReLU

当x<0时,f(x)=αx,其中α非常小,这样可以避免在x<0时,不能够学习的情况

f (x) = m a x (α x, x)

称为Parametric Rectifier(PReLU)

当 α=0.01 时,是Leaky ReLU.

优点:

不会过拟合(saturate)
计算简单有效
比sigmoid/tanh收敛快

指数线性单元ELU

f (x) = {α (e x - 1), x, x \leq 0 x > 0

由于需要计算指数,计算量较大

Maxout

函数图像为两条直线的拼接, f(x)=max(wT1x+b1,wT2x+b2)

那么,前边的两种ReLU便是两种Maxout.

激活层函数选择

最好不要用sigmoid,比如AlexNet等都不用sigmoid
首先试ReLU,速度快,但要注意训练的状态.
如果ReLU失效,试试Leaky ReLU或Maxout
试试tanh正切函数

在浅层神经网络中，如不超过4层的，可选择使用多种激励函数，没有太大的影响。特别的，RNN中使用ReLU或tanh（三角函数tan）；Hinge用于soft-margin svm算法；log用于LR算法（Logistric Regression）；squared loss用于线性回归（Liner Regression）和Boosting。

sigmoid作激活函数的缺点

σ (x) = 1 ( 1 + e - x )

,历史上很流行(Historically popular since they have nice interpretation as a saturating “firing rate” of a neuron),梯度为

∇σ=e−x(1+e−x)2=(1+e−x−11+e−x)(11+e−x)=σ(x)(1−σ(x)) ∇σ=e−x(1+e−x)2=(1+e−x−11+e−x)(11+e−x)=σ(x)(1−σ(x))

存在三个问题:

饱和的神经元会"杀死"梯度,指离中心点较远的x处的导数接近于0,停止反向传播的学习过程.
sigmoid的输出不是以0为中心,而是0.5,这样在求权重w的梯度时,梯度总是正或负的.
指数计算耗时

为什么tanh相比sigmoid收敛更快:

tanh′(x)=1−tanh(x)2∈(0,1)

sigmoid: s′(x)=s(x)×(1−s(x))∈(0,1/4)

可以看出tanh(x)的梯度消失问题比sigmoid要轻.梯度如果过早消失,收敛速度较慢.

原文: http://www.cnblogs.com/makefile/p/activation-function.html © 康行天下

分类: 深度学习

标签: 深度学习

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
原文: http://www.cnblogs.com/makefile/p/activation-function.html © 康行天下

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Tiger-Li CSDN认证博客专家 CSDN认证企业博客

码龄14年

75: 原创

2万+: 周排名

172万+: 总排名

440万+: 访问

: 等级

2万+: 积分

1158: 粉丝

1804: 获赞

214: 评论

7649: 收藏

私信

关注

热门文章

分类专栏

最新评论

直方图均衡化
starman584: 找的就是这个图片推导，别的不说，这个才是精华
定点数的表示方法
做而论道_CS: 补码提出来不就是为了方... －－－－－－－－－补码，就是用来唬你的。补码，实际上，就是正常的数字！计算机中，根本就没有补码。（更没有原码反码了）。你失去了正常的概念，已经走火入魔了。你是被人忽悠瘸了，手表，都看不懂了。
定点数的表示方法
cwxia0s: 根源是舍弃进位不假，然后呢，是为了解决什么问题，还不是加法当加法器用，补码提出来不就是为了方便的处理负数吗，不管取反加一也好，加一个周期也好，不管怎么看，总要实现出来，上升到思维的高度，小心走火入魔
定点数的表示方法
cwxia0s: 引用你自己博客写的： ``` 为什么要使用补码呢？补码，究竟是什么东西呢？其实，补码，就是一个【代替负数进行运算的正数】。有了补码，负数，就成了正数，减法运算，也就转成了加法运算。因此，加、减法，就都可以统一用加法运算。这么一来，计算机的硬件，就可以得到简化。 ``` 补码的意义再说，你看看你说的什么东西： ``` 舍弃进位，加法可以当减法，这是小朋友都能看懂的知识。计算机专家，为什么要编造符号位原码反码 ...，这些虚假的故事呢？因为，这些专家，小学都没有毕业！ ``` ``` 是先有的算法（即舍弃进位），才设计出来的电路。不是先有了电路，再引入补码的算法。 ``` 补码的意义是在实际中，简化电路设计，引入这种计算方式，这就是在电路设计背景下提出的，有错吗你的理解能力，素质，都堪忧，别回复我了，看你的言论就晦气
定点数的表示方法
做而论道_CS: 补码的计算是在电路设计的背景下引入的－－－－－－－－－你说的，不对啊！是先有的算法（即舍弃进位），才设计出来的电路。不是先有了电路，再引入补码的算法。是理论，指导实践。你这思维方式，还能搞个蛋的技术，真就不错了。

大家在看

【教程4＞第3章＞第12节】16PSK调制系统的FPGA开发与matlab验证

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。