深度学习各类激活函数简介

最新推荐文章于 2024-09-13 14:12:51 发布

nlp小仙女

最新推荐文章于 2024-09-13 14:12:51 发布

阅读量332

点赞数 1

分类专栏：评估指标文章标签：深度学习算法机器学习神经网络数据挖掘

原文链接：https://www.cnblogs.com/missidiot/p/9378079.html

版权

评估指标专栏收录该内容

1 篇文章 0 订阅

订阅专栏

深度学习各类激活函数

激活函数

激活函数

激活函数的定义：

激活函数的主要作用是提供网络的非线性建模能力。如果没有激活函数，那么该网络仅能够表达线性映射，此时即便有再多的隐藏层，其整个网络跟单层神经网络也是等价的。因此也可以认为，只有加入了激活函数之后，深度神经网络才具备了分层的非线性映射学习能力。那么激活函数应该具有什么样的性质呢？

可微性：当优化方法是基于梯度的时候，这个性质是必须的。
单调性：当激活函数是单调的时候，单层网络能够保证是凸函数。
输出值的范围：当激活函数输出值是有限的时候，基于梯度的优化方法会更加稳定，因为特征的表示受有限权值的影响更显著;当激活函数的输出是无限的时候，模型的训练会更加高效，不过在这种情况小，一般需要更小的learning rate

激活函数的定义

引入非线性因素。

在我们面对线性可分的数据集的时候，简单的用线性分类器即可解决分类问题。但是现实生活中的数据往往不是线性可分的，面对这样的数据，一般有两个方法：引入非线性函数、线性变换。

线性变换
　　就是把当前特征空间通过一定的线性映射转换到另一个空间，让数据能够更好的被分类。

激活函数
　　激活函数是如何引入非线性因素的呢？在神经网络中，为了避免单纯的线性组合，我们在每一层的输出后面都添加一个激活函数（sigmoid、tanh、ReLu、ELU、GELU等等），这样的函数长这样：

sigmod

sigmod数学表达式
在这里插入图片描述

tanh

tanh图片表达式
在这里插入图片描述
tanh也是一种非常常见的激活函数。与sigmoid相比，它的输出均值是0，使得其收敛速度要比sigmoid快，减少迭代次数。然而，从途中可以看出，tanh一样具有软饱和性，从而造成梯度消失。
sigmoid和tanh函数对比

RELU

RELU数学表达式
在这里插入图片描述

ELU

ELU数学表达式
在这里插入图片描述

GELU

GELU逼近正态分布表达式
GELU数学表达式

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。