激活函数的简单认识

最新推荐文章于 2024-07-11 23:31:47 发布

科研苟Gamber

最新推荐文章于 2024-07-11 23:31:47 发布

阅读量183

点赞数

分类专栏：图神经网络文章标签：深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hyh14/article/details/127853493

版权

图神经网络专栏收录该内容

9 篇文章 0 订阅

订阅专栏

激活函数，神经网络中的非线性变换，它可以使得神经网络几乎可以任意逼近任何非线性函数。如果没有激活函数，只剩下线性变换，那么，无论叠加多少层，神经网络还是一个线性变换模型。

S型激活函数

比较典型为Sigmoid和Tanh，这种激活函数的特点是有界。性状如S，数值越接近无穷，梯度越小，趋近于0.

Sigmoid：

常作为最后一层的激活函数，用于二分类。可以将任意数值转换为概率。值域为（0,1）。

Tanh：

值域为（-1,1）

ReLu和变种

ReLu：

这种分开处理的方式称为单侧抑制。在隐层中，这种特性会带来一定的稀疏性。又由于输入为正值时，梯度为1，可以缓解梯度消失的问题（随着神经网络层数增加，迭代乘，梯度会越乘越小，直至为0，没有梯度）。而且，ReLu的计算很高效。

但是，单侧抑制也会导致某个神经元死亡，就是，如果神经元的输出一直为负，那么在进行反向传播时，梯度一直为0，这个神经元不起作用，无法进行有效的更新。

为了解决这个问题，还与其他的ReLu的变种：

LeakyReLu：

不同于ReLu的，对于负值的绝对抑制， LeakyReLu对于负值允许一定量的信息通过。其中，λ>0是一个超参数，通常为0.2.这样就可以避免神经元死亡的现象发生。当然这样做，会慢下来。

PReLu：

更进一步，λ改为可以训练的参数α，每一个神经元可以有不用的参数，更高维的时候，也可以共享参数。

ELU：

前面的对于负值的输入都是进行的线性压缩，还可以进行非线性压缩。它具有调节激活值的均值为0的功能，可以加速神经网络的收敛。

科研苟Gamber

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
激活函数的简单认识

激活函数，神经网络中的非线性变换，它可以使得神经网络几乎可以任意逼近任何非线性函数。如果没有激活函数，只剩下线性变换，那么，无论叠加多少层，神经网络还是一个线性变换模型。
复制链接

扫一扫

专栏目录

科研苟Gamber CSDN认证博客专家 CSDN认证企业博客

码龄4年

36: 原创

6万+: 周排名

5万+: 总排名

3万+: 访问

: 等级

462: 积分

915: 粉丝

45: 获赞

11: 评论

160: 收藏

私信

关注

热门文章

分类专栏

最新评论

Glow模型【图解版加代码】
科研苟Gamber: 只是让Z的分布变为高斯分布，但是均值和标准差的来源是out的，这里的高斯分布不一定是标准正态N（0,1）（文章中应该没有提吧）
Glow模型【图解版加代码】
.Xa.: 为什么在Block的forward中计算log_p的均值和方差可以由输出另一半计算得来呀？有一些为什么直接让他直接服从标准正态分布
Cover-Lossless Robust Watermarking【文章学习】
Bubble_Qi: 您好求复现代码
《信息论与编码》曹雪虹
慈之雨林: 引用「单位为det。」单位错了，单位为hart
卷积与池化--初步理解
码农研究僧: 有点形象，通俗易懂

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。