(深度学习 by Andrew Ng)激活函数（Activation functions）

最新推荐文章于 2022-11-18 18:09:09 发布

麦地与诗人

最新推荐文章于 2022-11-18 18:09:09 发布

阅读量144

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/YPP0229/article/details/90778161

版权

深度学习专栏收录该内容

19 篇文章 3 订阅

订阅专栏

0.声明：

本文中所有的 $z$ ，都是 $z=w^Tx$ ，我们需要给 $z$ 加一个激活函数：
在这里插入图片描述

1.sigmoid函数

$g(z)=\frac{1}{1+e^{-z}}$
在这里插入图片描述

函数取值范围 $(0, 1)$
求 $g^{'} (z)$ , $g'(z)=\frac{-1\times (1+e^{-z})'}{(1+e^{-z})^2}=\frac{e^{-z}}{(1+e^{-z})^2}=\frac{1}{1+e^{-z}}(1-\frac{1}{1+e^{-z}})=g(z)(1-g(z))$
当 $z = 10$ 或 $z = - 10$ 时， $\frac{d}{dz}g(z)\approx 0$
当 $z = 0$ 时， $\frac{d}{dz}g(z)=g(z)(1-g(z))=1/4$
在神经网络中 $a = g (z)$ ，所以， $g^{'} (z) = a (1 - a)$

2.tanh函数

或叫做双曲正切函数，
$g(z)=tanh(z)=\frac{e^z-e^{-z}}{e^z+e^{-z}}$
在这里插入图片描述

函数取值范围 $(- 1, 1)$
求 $g^{'} (z)$ , $g'(z)=\frac{(e^z-e^{-z})'(e^z+e^{-z})-(e^z-e^{-z})(e^z+e^{-z})'}{(e^z+e^{-z})^2}=1-tanh^2(z)$
当 $z = 10$ 或 $z = - 10$ 时， $\frac{d}{dz}g(z)\approx 0$
当 $z = 0$ 时， $\frac{d}{dz}g(z)=1-tanh^2(0)=1$

从sigmod和tanh的函数图像可以看出，事实上，tanh函数是sigmoid的向下平移和伸缩后的结果。对它进行了变形后，穿过了点，并且值域介于+1和-1之间。

注意：

sigmoid函数和tanh函数两者共同的缺点是，在 $z$ 特别大或者特别小的情况下，导数的梯度或者函数的斜率会变得特别小，最后就会接近于0，导致降低梯度下降的速度。

3.ReLu函数

线性整流函数（Rectified Linear Unit, ReLU），又称修正线性单元，是一种人工神经网络中常用的激活函数。
$g (z) = m a x (0, z)$
在这里插入图片描述
只要是正值的情况下，导数恒等于1，当 $z$ 是负值的时候，导数恒等于0。从实际上来说，当使用 $z$ 的导数时， $z = 0$ 的导数是没有定义的。

$z < 0$ 时， $g^{'} (z) = 0$
$z > 0$ 时， $g^{'} (z) = 1$
注：通常在 $z = 0$ 的时候给定其导数1,0；当然 $z = 0$ 的情况很少

4.Leaky Relu

是另一个版本的Relu， $a = m a x (0.01 z, z)$
在这里插入图片描述
当 $z$ 是负值时，这个函数的值不是等于0，而是轻微的倾斜，如上图。
为什么常数是0.01？当然，可以为学习算法选择不同的参数。

麦地与诗人

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
(深度学习 by Andrew Ng)激活函数（Activation functions）

1.sigmoid函数σ(z)=11+e−z\sigma(z)=\frac{1}{1+e^{-z}}σ(z)=1+e−z1函数取值范围(0,1)(0,1)(0,1)用matlab画出sigmoid的函数图像：x=linspace(-10.0,10.0);y=1./(1.0+exp(-1.0*x));plot(x,y)2.tanh函数或叫做双曲正切函数，tanh=sinh...
复制链接

扫一扫

专栏目录