各种激活函数, 图像, 导数及其特点

小夏refresh

已于 2024-06-17 10:41:13 修改

阅读量3.8k

点赞数 4

分类专栏：机器学习文章标签：神经网络深度学习机器学习人工智能

于 2020-08-24 09:09:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c2861024198/article/details/108192771

版权

机器学习专栏收录该内容

14 篇文章

订阅专栏

文章目录

- sigmoid
- tanh
- - 特点
  - 导数
- Relu
- Leaky Relu(PRelu)
- - 导数
  - 特点
- ELU
- - 导数
  - 特点
- SELU
- - 导数
  - 特点
- SoftMax
- - 导数
  - 特点

sigmoid

$f(z)=\frac1{1+e^{-z}}$

其图像如下:
sigmoid

特点

能够将输入的连续实值变换为0到1之间的输出

缺点

在深度神经网络中梯度反向传播是容易造成梯度爆炸和梯度消失

sigmoid导数

$\frac{e^{-z}}{(1+e^{-z})^2} = \frac1{1+e^{-z}} - \frac1{(1+e^{-z})^2}$

tanh

$\frac{e^x-e^{-x}}{e^x+e^{-x}}$

其图像如下:
tanh

特点

解决了sigmoid函数不是zero-centered的问题, 但是梯度消失依旧存在

导数

$tanh'(x)=1-tanh(x)^2 = 1 - (\frac{e^x-e^{-x}}{e^x+e^{-x}})^2$

Relu

$R e l u (x) = ma x (0, x)$

函数图像

relu

导数

$\begin{cases} 0& x\leq 0\\ 1& x> 0 \end{cases}$

优点

解决了梯度消失问题
计算速度非常快
收敛速度远快于sigmoid和tanh

缺点

输出的不是zero-centered
有些神经元可能永远不会被激活(Dead ReLU)
- 不好的参数初始化
- 学习率过高, 导致网络不幸进入这种情况

Leaky Relu(PRelu)

$max(\alpha x, x)$

函数图像 $\alpha=0.01$
leakrelu

导数

$\begin{cases} \alpha& x\leq0\\ 1& x> 0 \end{cases}$

特点

具有ReLU的所有优点
不会有Dead ReLU问题

ELU

$\begin{cases} x& x>0\\ \alpha(e^x-1)& x\leq0 \end{cases}$

函数图像 $\alpha=1$

elu

导数

$\begin{cases} 1&x>0\\ f(x)+\alpha = \alpha e^x& x\leq0 \end{cases}$

特点

类似于Leaky ReLU
计算量稍大
不会有Dead ReLU问题
均值接近于0

SELU

$=\lambda \begin{cases} x& x>0\\ \alpha e^x-\alpha& x\leq0 \end{cases}\\ 其中\lambda=1.0507009873554804934193349852946\\ \alpha=1.6732632423543772848170429916717$

函数图像
selu

导数

$selu'(x)=\lambda \begin{cases} 1& x>0\\ \alpha e^x \end{cases}$

特点

在ELU的基础上求解了最佳的 $\alpha$ , 并且扩大了 $\lambda$ 倍,
SELU拥有ELU所有的优点
不存在死区

SoftMax

$f(x_i)=\frac{e^{x_i}}{\sum_{j=1}^ne^{x_j}}$

简单地说, 就是当前元素的值就等与e的当前元素次方在所有元素的e的次方和的比例
softmax

导数

$LOSS=-\sum_it_ilny_i, 其中, t_i表示真实值 \\当预测第i个时, 可以认为t_i=1, 那么LOSS=-\sum lny_i\\因为softmax的和为1, 那么\frac{e^{x^i}}{\sum_{j=1}^ne^{x_{j}}},对Loss求导后为-(1-\frac{\sum^n_{i\neq j}e^{x_i}}{\sum^n_je^{x_j}})=y_i-1$

也就是说, 只要求出 $j_i$ , 那么减一就是梯度.

特点

Softmax会将整个超空间按照分类个数进行划分
Softmax会比其他的激活函数更适合多分类问题最后的激活

博客等级

码龄7年

39
原创

271
点赞

582
收藏

178
粉丝

关注

私信

热门文章

分类专栏

论文 13篇
语义分割 3篇
计算机视觉 10篇
深度学习 11篇
工具 2篇
wsl2 1篇
数据挖掘 4篇
机器学习 14篇
linux 1篇
推荐算法 1篇
数据分析 1篇
Python 3篇
最大似然估计 1篇
极大似然估计 1篇
编程语言 1篇
markdown 1篇
爬虫 1篇
C语言 5篇
数据结构 5篇

最新评论

2024AAAI SCTNet论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读笔记: Segment Anything
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记: Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读笔记:RepViT: Revisiting Mobile CNN From Vit Perspective
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小夏refresh 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。