激活函数总结

最新推荐文章于 2024-07-25 10:59:02 发布

zhao_jiangshan

最新推荐文章于 2024-07-25 10:59:02 发布

阅读量733

点赞数 14

文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhao_jiangshan/article/details/140591238

版权

针对目前比较常用的一些激活函数，对他们的性质以及特点进行分析总结，便于后面的理解以及在模型里面的使用。目前主要总结的激活函数包括：Sigmoid、Tanh、Relu、Leaky Relu以及Softmax。

激活函数的作用：

如果不用激活函数，每一层输出都是上层输入的线性函数，无论神经网络有多少层，输出都是输入的线性组合，这是最原始的感知机；

使用激活函数可以给神经元引入非线性元素，使得神经网络可以任意逼近任何非线性函数，使得深层神经网络表达的能力更加强大，这样神经网络经可以应用到众多的非线性模型中。

补充：包含函数以及非饱和函数

饱和激活函数：

假设h(x)是一个激活函数

1、当x趋近于正无穷，激活函数的导数趋近于0，则称其为右饱和。

2、当x趋近于负无穷，激活函数的导数趋近于0，则称其为左饱和。

3、当一个激活函数既满足左饱和又满足右饱和，我们就称其为饱和激活函数。比如：Sigmoid、Tanh。

Sigmoid函数将输入的值压缩到【0，1】范围，tanh函数将输入的值要锁到【-1，1】范围。

非饱和激活函数：

当激活函数不满足饱和激活函数后，就称为非饱和激活函数，例如 Relu、Leaky Relu。

相较于饱和激活函数，非饱和激活函数的优势：

1、非饱和激活函数能解决深度神经网络(层数非常多)带来的梯度消失问题；

2、非饱和激活函数可以加快收敛速度。

首先，简单的介绍一下常见的两个饱和激活函数：Sigmoid、Tanh

一、Sigmoid激活函数的数学表达式：

函数图像如下：

Sigmoid函数在历史上曾非常常用，输出的范围是【0，1】之间的实数。但现在不太受欢迎，实际很少用到。

Sigmoid的使用条件：

1、 Sigmoid函数的输出范围在0到1之间。非常适合为输出为0到1之间的模型的输出函数，比如用于表示二分类的类别或者表示置信度；

2、梯度平滑，便于求导，也防止模型训练过程中的突变的梯度。

Sigmoid的缺点：

1、容易造成梯度消失。sigmoid的导数小于0.25，在进行反向传播的过程中，梯度相乘的结果会趋向0。这样梯度信号不能通过神经元传递到前面层的梯度更新中，前面层的权值几乎没有更新，造成梯度消失。此外，为了防止饱和，必须将权重矩阵的初始化特别留意。如果初始化权重过大，可能很多神经元得到一个比较小的梯度，导致神经元不能很好的更新权重提前饱和，神经网络几乎不学习；

2、 函数输出不以0为中心，梯度可能会向特定方向移动，从而降低权重更新的效率；

3、 Sigmoid函数执行指数运算，计算机运行的较慢，比较消耗计算资源。

二、Tanh函数的数学表达式：

函数图像：

tanh是“以0为中心”的，在实际应用的过程中，tanh比sigmoid好一些。但是在饱和神经元的情况下，tanh还是没有解决梯度消失的问题。

Tanh的优势：

1、 tanh的输出间隔为1，并且整个函数以0为中心，比sigmoid好；

2、在tanh中，负输入将被强制映射为负，零输入被映射为0。

tanh的缺点：

1、存在梯度饱和的问题；

2、依然进行指数运算，计算比较缓慢，比较浪费计算资源。

现在介绍一些非饱和激活函数：Relu、Leaky Relu：

一、Relu激活函数的数学表达式：

函数图像：

Relu的优势：

1、 Relu解决了梯度消失的问题，当输入值为正时，神经元不会饱和；

2、由于Relu线性、非饱和的性质，在SGD中可以快速收敛；

3、计算复杂度低，不需要进行指数运算。

Relu缺点：

1、与sigmoid一样，输出不是以0为中心；

2、当输入为负时，梯度为0。这个神经元及之后的神经元的梯度永远为0，不在对任何数据有响应，导致相应参数不会更新。

训练神经网络的时候，一旦学习率没有设置好，第一次更新权重的时候，输入是负值，这个含有Relu神经节点就会死亡，再也不会被激活，要设置一个合适的较小的学习率，以降低这种情况的发生。

二、 Leaky Relu激活函数的数学表达式：

函数图像：

Leaky Relu的优点：

1、解决了Relu输入值为负时神经元出现死亡的问题；

2、 Leaky Relu线性，非饱和的性质，在SGD中快速收敛；

3、计算复杂度低，不需要进行指数运算。

Leaky Relu的缺点：

1、函数中的c，需要进行先验知识人工赋值(一般设置为0.01)；

2、有些近似线性，导致复杂分类中效果不好。

三、 Softmax激活函数的数学表达式：

函数图像：

softmax函数在神经网络输出层充当激活函数，将输出层的值通过激活函数映射到0到1之间，将神经元输出构造成概率分布，用于多分类问题，softmax几乎函数的映射值越大，真实类别的可能性越大。

说明：发布的内容为在网上一些比较好的帖子的总结，便于自己学习使用

关注

14
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
激活函数总结

softmax函数在神经网络输出层充当激活函数，将输出层的值通过激活函数映射到0到1之间，将神经元输出构造成概率分布，用于多分类问题，softmax几乎函数的映射值越大，真实类别的可能性越大。训练神经网络的时候，一旦学习率没有设置好，第一次更新权重的时候，输入是负值，这个含有Relu神经节点就会死亡，再也不会被激活，要设置一个合适的较小的学习率，以降低这种情况的发生。Sigmoid函数的输出范围在0到1之间。Sigmoid函数将输入的值压缩到【0，1】范围，tanh函数将输入的值要锁到【-1，1】范围。
复制链接

扫一扫

博客等级

码龄1年

4
原创

39
点赞

23
收藏

42
粉丝

关注

私信

热门文章

最新评论

iou的计算代码
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
激活函数总结
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/619180681。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。