神经网络中的激活函数

最新推荐文章于 2024-07-17 16:06:38 发布

lankuohsing

最新推荐文章于 2024-07-17 16:06:38 发布

阅读量1.1k

点赞数

分类专栏：学习笔记理论学习文章标签：深度学习神经网络激活函数

本文链接：https://blog.csdn.net/THUChina/article/details/80636338

版权

学习笔记同时被 2 个专栏收录

53 篇文章 0 订阅

订阅专栏

理论学习

46 篇文章 1 订阅

订阅专栏

文章目录

tanh(z)=\frac{e^z-e^{-z}}{e^z+e^{-z}}

效果严格地比

s i g m o i d

函数好，因为该函数的对称中心在

(0, 0)

，具有将数据归一化为0均值的效果。当然，二分类的输出层的激活函数还是一般用

s i g m o i d (z)

，因为

s i g m o d

函数能将输出值映射到

0\sim1

之间（概率值）

R e l u (z) = m a x (0, z)

出现后，神经网络默认都用

R e l u

函数（rectified linear）来作为激活函数。此时一般默认

z > 0

l e a k y (z) = m a x (0.01 z, z)

可以避免

z < 0

时斜率为零的情况输出层有时也用线性激活函数（房价预测）

0. Linear Activate Function

https://towardsdatascience.com/activation-functions-neural-networks-1cbd9f8d91d6
也叫identity activate Function，即对原始输出不做任何变换

1. Sigmoid activation function

图1.1 激活函数-sigmoid \begin{align*} a&=g(z) \\ &=\frac{1}{1+e^{-z}}\\ \tag{1-1} \end{align*} \begin{align*} g'(z)&=\frac{d}{dz}g(z)\\ &=\frac{e^{-z}}{1+e^{-z}}\\ &=\frac{1}{1+e^{-z}}\left(1-\frac{1}{1+e^{-z}}\right)\\ &=g(z)\left(1-g(z)\right)\\ &=a(1-a)\\ \tag{1-2} \end{align*} ## 2. Tanh activation function

图2.1 激活函数-tanh

$\begin{aligned} a&=g(z) \\ &=\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}}\\ \tag{2-1} \end{aligned}$

$\begin{aligned} g'(z)&=\frac{d}{dz}g(z)\\ &=\frac{e^{-z}}{1+e^{-z}}\\ &=\frac{\left(e^{z}+e^{-z}\right)^2-\left(e^z-e^{-z}\right)^2}{\left(e^z+e^{-z}\right)^2}\\ &=1-\left(g(z)\right)^2\\ &=1-a^2\\ \tag{2-2} \end{aligned}$

3. ReLU and Leaky ReLU

图3.1 激活函数-ReLU

ReLU:
$\begin{aligned} a&=g(z) \\ &=max(0,z)\\ \tag{3-1} \end{aligned}$
$\begin{aligned} g'(z)&=\frac{d}{dz}g(z)\\ &=\left\{ \begin{aligned} 0\quad if\ z<0\\ 1\quad if\ z\geq0 \end{aligned} \right. \tag{3-2} \end{aligned}$
Leaky ReLU:

图3.2 激活函数-Leaky ReLU

$\begin{aligned} a&=g(z) \\ &=max(0.01z,z)\\ \tag{3-3} \end{aligned}$
$\begin{aligned} g'(z)&=\frac{d}{dz}g(z)\\ &=\left\{ \begin{aligned} 0.01\quad if\ z<0\\ 1\quad if\ z\geq0 \end{aligned} \right. \tag{3-4} \end{aligned}$

4.选择激活函数的准则

如果处理的问题是二分类问题，输出为0和1，那么输出层选择sigmoid函数，其他神经元选择ReLU(有时也可用tanh)，理论上Leaky ReLU比ReLU好，但是实践中差不多。

lankuohsing

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
神经网络中的激活函数

1. Sigmoid activation function2. Tanh activation function3. ReLU and Leaky ReLU4.选择激活函数的准则tanh(z)=ez−e−zez+e−ztanh(z)=ez−e−zez+e−ztanh(z)=\frac{e^z-e^{-z}}{e^z+e^{-z}}效果严格地比sigmoidsigmo...
复制链接

扫一扫

专栏目录