深度学习常用激活函数介绍和使用

Janie.Wei

于 2020-07-12 15:33:37 发布

阅读量692

点赞数 1

分类专栏：深度学习文章标签：神经网络激活函数饱和激活函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weijie_home/article/details/107285178

版权

深度学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

激活函数（Activation Function）：在神经网络神经元上运行的函数，负责将神经元的输入映射到输出端。

入激活函数是为了增加神经网络模型的非线性。没有激活函数的每层都相当于矩阵相乘，就算叠加若干层，无非还是矩阵相乘。

1. Sigmoid函数

注： Sigmoid一般不与MSE配合使用。

因为Sigmoid的导数为f(x)(1−f(x))。假设当预测值为f(x)=1而真实值为0的时候，此时虽然(yi−y˜)很大，但是f(x)(1−f(x))太小接近0，收敛速度同样很慢。

2. Tanh函数

3. ReLU函数

4. MaxOut函数

Maxout是深度学习网络中的一层网络，可以看成是网络的激活函数层。假设网络某一层的输入特征向量为：X=（x1,x2,……xd）Maxout隐藏层每个神经元的计算公式如下：

Z的计算公式为：

权重w是一个大小为(d,m,k)三维矩阵，b是一个大小为(m,k)的二维矩阵，这两个就是需要学习的参数。

优点：

（1）Maxout具有ReLU的所有优点，线性、不饱和性。

（2）同时没有ReLU的一些缺点。如：神经元的死亡。
缺点：参数的数量激增

补充内容：

1）饱和激活函数

sigmoid和tanh是“饱和激活函数”，而ReLU及其变体则是“非饱和激活函数”。

使用“非饱和激活函数”的优势在于两点：(1)"非饱和激活函数”能解决所谓的“梯度消失”问题。(2)它能加快收敛速度。

2）神经元死亡

大的梯度导致某个神经元权重更新的过猛，之后小的梯度对它的权重更新太慢，使得模型训练陷入了僵局。遍历了整个训练集，它的参数都没有更新。因此就说该神经元死了……

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习常用激活函数介绍和使用

注： Sigmoid一般不与MSE配合使用。在深度学习里，Sigmoid函数是常见的激活函数。特别注意的是，当使用Sigmoid做激活函数的时候，损失函数不能选择MSE。因为Sigmoid的导数为f(x)(1−f(x))。假设当预测值为f(x)=1而真实值为0的时候，此时虽然(yi−y˜)很大，但是f(x)(1−f(x))太小接近0，收敛速度同样很慢。...
复制链接

扫一扫

专栏目录

Janie.Wei CSDN认证博客专家 CSDN认证企业博客

码龄10年

60: 原创

7万+: 周排名

74万+: 总排名

14万+: 访问

: 等级

1290: 积分

29: 粉丝

119: 获赞

36: 评论

642: 收藏

私信

关注

热门文章

分类专栏

最新评论

情感识别相关数据集总结
李为荣: 哥们你找到ESVG数据集的获取方式了吗；浏览器都要搜爆了都没找到，真的急，救救孩子吧。
语音信号的时域、频域含义及其表示
m0_63643797: 很厉害，通俗易懂。
情感识别相关数据集总结
weixin_46037267: 我问了作者，但是它里面只有视频数据，没有相应的划分train/test split
情感识别相关数据集总结
Googlo666: github有google云盘的链接，ekman6的需要跟作者申请下权限
情感识别相关数据集总结
weixin_46037267: 您好，请问您有ekman6的数据集标签嘛，我问作者没有回复

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。