常用激活函数简介

最新推荐文章于 2024-09-22 23:33:44 发布

PonyMzp

最新推荐文章于 2024-09-22 23:33:44 发布

阅读量78

点赞数

分类专栏：机器学习文章标签：机器学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ponymzp/article/details/132582926

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

激活函数

API

torch activation functions api torch.nn
keras activation functions api tf.keras.activations
tensorflow activation functions api tf.nn
wiki activation functions

性质

激活函数应该具备如下性质：

非线性：保证多层网络不退化成单层线性网络。
可微性：保证梯度或SubGradient的可计算性。
单调性：(非强制)保证单层网络是凸函数， mish例外。

S Model

Sigmoid

函数：
$\sigma \left( x\right) =\dfrac {1} {1+e^{-x}}$
导数：
$\sigma'(x) = \sigma(x) \cdot (1 - \sigma(x))$
图像：

Sigmodi

def Sigmoid(x):
	return 1. / (1 + np.exp(-x))

优点
1. 梯度平滑，求导容易。
2. 输出映射在(0, 1)之间，单调连续，优化稳定。
缺点
1. 计算量大：包含指数运算。
2. 梯度消失：输入值较大或较小时，Sigmoid导数则接近于零，在反向传播时，参数更新较慢。
3. Sigmoid 的输出不是0中心(Zero-Centered)。
参考
1. sigmoid wiki

Tanh

等价于Sigmoid的平移与缩放，函数：
$\frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}$

导数：
$tanh'(x) = 1 - tanh(x)^{2}$
图像：

Tanh

def tanh(x):
	return np.sinh(x)/np.cosh(x)

优点
1. 比Sigmoid函数收敛速度更快。
2. tanh(x) 的梯度消失问题比 sigmoid 要轻。
3. 相比Sigmoid函数，输出是以 0 为中心 Zero-Centered.
缺点
1. 计算量大。
2. 梯度消失。

Linear Unit

论文 Fast and Accurate Deep Network Learning by Exponential Linear Units (ELUs)

ReLU

整流线性单元，Rectified Linear Unit.

$ELU(x)=\begin{cases} x, & if & x>0 \\ 0 & if & x \leq 0 \end{cases}$
图像

ReLU

```python def ReLU(x): return x * (x > 0) ``` 1. 优点 1. 计算与收敛速度非常快，不涉及指数等运算。 2. 一定程度缓解梯度消失问题，因为导数为 1，不会像 sigmoid 那样由于导数较小，而导致连乘得到的梯度逐渐消失。 2. 缺点 1. 某些神经元可能永远不会被激活，导致相应的参数永远不能被更新。 ### ELU

指数线性单元，Exponential Linear Unit.

$ELU(x)=\begin{cases} x, & if & x>0 \\ \alpha (e^x-1) & if & x \leq 0 \end{cases}$
图像：

ELU

def ELU(x, alpha):
    return x if x > 0 else alpha * (exp(x) - 1)

优点
1. 能避免死亡 ReLU 问题：x 小于 0 时函数值不再是 0，因此可以避免 dying relu 问题。
2. 能得到负值输出，这能帮助网络向正确的方向推动权重和偏置变化。
缺点
1. 计算耗时：包含指数运算。
2. α 值是超参数，需要人工设定。

SELU

尺度指数线性单元，Scale Exponential Linear Unit. 参见论文 Self-Normalizing Neural Networks.

$SELU(x)=\lambda \begin{cases} x, & if & x>0 \\ \alpha (e^x-1) & if & x \leq 0 \end{cases}$
图像：

SELU

def SELU(x, alpha, scale):
    return scale * x if x > 0 else scale * alpha * (exp(x) - 1)

优点
1. SELU 激活能够对神经网络进行自归一化（self-normalizing）。
2. 不可能出现梯度消失或爆炸问题，论文附录的定理 2 和 3 提供了证明。
缺点
1. 应用较少，需要更多验证。

Soft Model

Softmax

Softmax 用于多分类工程，将多个输入映射到(0-1] 区间内，可以看成概率，从而进行多分类。

假设数组 $X$ , $x_i$ 表示 $X$ 中的第 $i$ 个元素，那么，该元素的Softmax值为：

$Softmax(x_i)=\frac {e^{x_i}} {\sum_j e^{x_j}}$

Softmin

$Softmin(x_i)=\frac {e^{-x_i}} {\sum_j e^{-x_j}}$

LogSoftmax

$LogSoftmin(x_i)=Log\left(\frac {e^{x_i}} {\sum_j e^{x_j}}\right)$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄6年

11
原创

7
点赞

14
收藏

4
粉丝

关注

私信

热门文章

分类专栏

机器学习 3篇
SQL 1篇
软件开发 2篇
算法面试 1篇
VsCode 1篇
网格剖分 1篇

最新评论

常用激活函数简介
CSDN-Ada助手: 恭喜您写了第9篇博客！标题中的“常用激活函数简介”非常吸引人。您对激活函数进行了简明扼要的介绍，让读者能够快速了解它们的作用和特点。接下来，我建议您可以深入探讨每种激活函数的数学原理，并结合实际案例进行说明。这样可以让读者更好地理解它们在神经网络中的应用。再次恭喜您的持续创作，期待您的下一篇博客！
VsCode 修改中文显示
太过。: 你好，请问打不开loclae.json文件怎么办呀？
FreeFEM++根据给定网格尺寸剖分网格
qq_43482010: 大佬可以麻烦您帮调一下，freefem＋＋的代码吗，这东西太冷门了，已经无处可求救
VsCode 修改中文显示
tao1617: 谢谢，已解决~

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。