激活函数

最新推荐文章于 2023-04-15 10:08:21 发布

num270710

最新推荐文章于 2023-04-15 10:08:21 发布

阅读量112

点赞数

分类专栏： CNN

本文链接：https://blog.csdn.net/num270710/article/details/103049619

版权

CNN 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

1. 激活函数的作用

激活函数的作用是为了增加神经网络模型的非线性。否则你想想，没有激活函数的每层都相当于矩阵相乘。就算你叠加了若干层之后，无非还是个矩阵相乘罢了。所以你没有非线性结构的话，根本就算不上什么神经网络。

2. 梯度消失

在神经网络中，将经过反向传播之后，梯度值衰减到接近0的现象称作梯度消失现象。

3. $s i g m o i d 函数$

$\frac{1}{1+e^{-x}} = (1+e^{-x})^{-1}\\\\ f'(x) = -1 * (1+e^{-x})^{-2} * (1+e^{-x})'\\\\ = -1 * (1+e^{-x})^{-2} * e^{-x} * (-x)'\\\\ = -1 * (1+e^{-x})^{-2} * e^{-x} * (-1)\\\\ = \frac{e^{-x}}{(1+e^{-x})^{2} }\\\\ = \frac{1+e^{-x}-1}{(1+e^{-x})^{2}}\\\\ = \frac{1}{1+e^{-x}} - \frac{1}{(1+e^{-x})^{2}}\\\\ = \frac{1}{1+e^{-x}} * (1 - \frac{1}{1+e^{-x}})\\\\ =f(x) * (1-f(x))$

sigmoid函数只有在x接近于0的地方，导数才比较大，但最大值也只有1/4;
在x的数值非常大或者非常小的地方，导数都接近与0.

反向传播 $\frac{\partial L}{\partial x} = \frac{\partial L}{\partial y} * \frac{\partial y}{\partial x}$ ，这将导致 $\frac{\partial L} {\partial x}$ 会显著的小于 $\frac{\partial L} {\partial y}$

如果x是非常大或者非常小的地方，则x的梯度将接近于0
即使x的数值接近于0，其梯度最大不超过y的梯度的1/4，如果由多层网络使用sigmoid激活函数，则导致靠前的那些层，梯度变得非常小。

2. 双曲正切函数： $t a n h (x)$

$\begin{aligned} f(x) & = tanh(x) \\\\ & = \frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}\\\\ \end{aligned}$

令 $a = e^{x}, b = e^{-x}$ ，根据 $(\frac{u}{v})' = \frac{u'v - uv'}{v^{2}}$ ，则有

$\begin{aligned} f'{x} & = (\frac{e^{x} - e^{-x}}{e^{x} + e^{-x}})'\\\\ & = (\frac{a - b}{a + b})'\\\\ & = \frac{(a - b)'(a + b) - (a - b)(a + b)'}{(a + b)^{2}} \end{aligned}$
$\begin{aligned} (a - b)' = (e^{x} - e^{-x})' = e^{x} - (-1) * e^{-x} = e^{x} + e^{-x} = a + b \end{aligned}$

$\begin{aligned} (a + b)' = (e^{x} + e^{-x})' = e^{x} + (-1) * e^{-x} = e^{x} - e^{-x} = a - b \end{aligned}$
$\begin{aligned} & \frac{(a - b)'(a + b) - (a - b)(a + b)'}{(a + b)^{2}}\\\\ & = \frac{(a + b)^{2} - (a - b)^{2}}{(a + b)^{2}}\\\\ & = 1 - (\frac{a - b}{a + b})^{2}\\\\ & = 1 - (\frac{e^{x} - e^{-x}}{e^{x} + e^{-x}})^{2}\\\\ & = 1 - (tanh(x))^{2}\\\\ & = 1 - (f(x))^{2} \end{aligned}$

余弦正切函数及其导数视图

3. Relu函数

$f (x) = m a x (0, x)$

$\begin{cases} 0, & x < 0 \\ 1, & x \geq 0 \end{cases}$
在这里插入图片描述

num270710

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
激活函数

1. sigmoid函数sigmoid函数sigmoid函数f(x)=11+e−x=(1+e−x)−1f′(x)=−1∗(1+e−x)−2∗(1+e−x)′=−1∗(1+e−x)−2∗e−x∗(−x)′=−1∗(1+e−x)−2∗e−x∗(−1)=e−x(1+e−x)2=1+e−x−1(1+e−x)2=11+e−x−1(1+e−x)2=11+e−x∗(1−11+e−x)=f(x)∗(1−f(x)...
复制链接

扫一扫