PyTorch常用激活函数解析

PyTorch常用激活函数

在深度学习中,经常会见到各种各样的激活函数。为了更好的学习,总结下我经常用的激活函数。具体信息可见官网

sigmoid

在这里插入图片描述
在这里插入图片描述

import torch.nn.functional as F
y=F.sigmoid(x)  #x则是输入

所有的输出会被放缩在0到1之间

缺点:

  • 会导致梯度消失的问题,网络只有微小的更新,无法有效学习

整流线性单元ReLU

表达式:ReLU(x)=max(0,x)

在这里插入图片描述

import torch.nn.functional as F
y=F.relu(x)  #x则是输入

优点:

  • 相比于 sigmoid,由于稀疏性,时间和空间复杂度更低;不涉及成本更高的指数运算;
  • 能避免梯度消失问题

缺点:

  • 引入了死亡 ReLU 问题,即网络的大部分分量都永远不会更新。但这有时候也是一个优势;
  • ReLU 不能避免梯度爆炸问题

指数线性单元 ELU

在这里插入图片描述

在这里插入图片描述

优点:

  • 能避免死亡 ReLU 问题;
  • 能得到负值输出,这能帮助网络向正确的方向推动权重和偏置变化;
  • 在计算梯度时能得到激活,而不是让它们等于 0;

缺点:

  • 由于包含指数运算,所以计算时间更长;神经网络不学习 α 值。

渗漏型整流线性单元激活函数(Leaky ReLU)

渗漏型整流线性单元激活函数也有一个 α 值,通常取值在 0.1 到 0.3 之间。
在这里插入图片描述

在这里插入图片描述

import torch.nn.functional as F
y=F.leaky_relu((x),negative_slope=0.2)  #x则是输入

优点:

  • 类似 ELU,Leaky ReLU 也能避免死亡 ReLU 问题,因为其在计算导数时允许较小的梯度;
  • 由于不包含指数运算,所以计算速度比 ELU 快。

缺点:

  • 无法避免梯度爆炸问题;神经网络不学习 α 值。

Tanh

在这里插入图片描述

在这里插入图片描述

参考

https://mp.weixin.qq.com/s/np_QPpaBS63CXzbWBiXq5Q

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值