深度学习网络各种激活函数 Sigmoid、Tanh、ReLU、Leaky_ReLU、SiLU、Mish

激活函数的目的就是为网络提供非线性化

梯度消失:梯度为0, 无法反向传播,导致参数得不到更新
梯度饱和:随着数据的变化,梯度没有明显变化
梯度爆炸:梯度越来越大,无法收敛

梯度消失问题:
1、反向传播链路过长,累积后逐渐减小
2、数据进入梯度饱和区

如何解决:
1、选正确激活函数,relu, silu
2、BN 归一化数据
3、 resnet 较短反向传播路径
4、LSTM 记忆网络

1、Sigmoid

函数和导数:
在这里插入图片描述
在这里插入图片描述
特点落入两端的数据导数趋于0,造成梯度消失,用在深度网络难以收敛。用 BN 批量归一化可以优化此问题。

2、Tanh

函数和导数:
在这里插入图片描述
在这里插入图片描述
特点和sigmoid 差不多,就是映射区间不同而已。

3、ReLU

在这里插入图片描述
在这里插入图片描述
特点简单粗暴,解决梯度消失问题,响应区间导数为1。小于0 的神经元被抑制,造成网络稀疏,抑制过拟合,利于网络学习有效信息,加快收敛速度。

4、Leaky_ReLU

在这里插入图片描述
在这里插入图片描述
特点:** 对relu的改进,小于0也有微小激活,避免梯度锯齿问题。**

5、SiLU(swish)

在这里插入图片描述
在这里插入图片描述
特点:** 对relu的改进,在0附近进行平滑,缺点:引入指数运算,增加计算量。**

6、Mish

在这里插入图片描述

特点:** 和silu 差不多。**

  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值