神经网络--激活函数

吗喽哥

已于 2024-03-08 22:29:03 修改

阅读量784

点赞数 13

文章标签：神经网络人工智能深度学习

于 2024-03-08 22:21:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_66672931/article/details/136572958

版权

前言

深度学习是机器学习的一个子集,区别在于是否包含特征工程.由输入层,输出层,隐藏层三部分构成.

一、激活函数是什么？

激活函数用于对每层的输出数据进行变换,进而为整个网络注入了非线性因素.此时,神经网络就可以拟合各种曲线.

二、常见的激活函数

1.sigmoid激活函数

1.激活函数公式:

2 激活函数求导公式:

3.激活函数图像

4.特点

sigmoid函数可以将任意的输入和输出映射到0,1之间,当输入的值大致在<-6或者>6时,意味着输入任何值得到的激活值都是差不多的,会丢失信息. 例如:100和10000的激活活值都是1,但输入之间差100倍的信息就丢失了.

在[-3,3 ]区间才会比较有效果.

其导数范围是0-0.25 ,当小于-6或者大于6时,激活函数图像的导数接近为0,此时网络更新即为缓慢.或者无法更新.

在五层之内会产生梯度消失的线性,而且,激活函数并不是以0为中心的,所以一般只用于是否的二分类问题.

2.tanh激活函数

特点:

tanh函数将值映射到(-1,1)之间,图像以0为中心,在0点对称,当输入大概小于-3或者大于3的时候被映射为-1或者1

其导数范围是0,1

当输入大概是在小于-3或者大于3的时候导数为0

一般在隐藏层使用.

3.relu激活函数

特点:

relu激活函数将小于0的映射为0,大于0的保持不变,更加重视正信号,而忽略负信号,运算简单,能提高模型训练效率.

当小于0时,导数为0,当x大于0时,则不存在饱和问题,所以在大于0时,能够保持梯度不衰减,从而缓解梯度消失的问题.然而,随着训练的推进,部分输入会落入小于0的区域,导数对应权重无法更新,成为神经元死亡

采用sigmoid函数，计算量大（指数运算），反向传播求误差梯度时，计算量相对大，而采用

Relu激活函数，整个过程的计算量节省很多。 sigmoid函数反向传播时，很容易就会出现梯度

消失的情况，从而无法完成深层网络的训练。 Relu会使一部分神经元的输出为0，这样就造成了

网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生

4.softmax激活函数

二分类sigmoid在多分类上的推广,目的是将多分类的结果以概率值的形式展示出来.

理解成概率,选取概率最大的,也就是值对应最大的,最为预测目标类别

三、激活函数的选择

隐藏层:

优先选择relu激活函数,使用relu要注意神经元死亡的问题,避免出现大的梯度,从而导致过多的神经元死亡

输出层:

是否二分类问题选择sigmoid激活函数,多分类问题选择softmax激活函数.

关注

13
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
神经网络--激活函数

深度学习是机器学习的一个子集,区别在于是否包含特征工程.由输入层,输出层,隐藏层三部分构成.
复制链接

扫一扫

吗喽哥 CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

133万+: 周排名

10万+: 总排名

1万+: 访问

: 等级

359: 积分

144: 粉丝

203: 获赞

16: 评论

155: 收藏

私信

关注

热门文章

最新评论

深度学习-梯度优化方法
CSDN-Ada助手: 恭喜用户第14篇博客《深度学习-梯度优化方法》成功发布！您对深度学习领域的探索和分享让读者受益匪浅。接下来，建议您可以深入探讨不同梯度优化方法的优劣势，并结合实际案例进行分析，以便读者更好地理解和应用。希望您继续保持创作热情，为大家呈现更多有价值的内容！期待您的下一篇作品！
深度学习-学习衰减方法
CSDN-Ada助手: 恭喜您发布第15篇博客！看到您对深度学习学习衰减方法的探讨，让我受益匪浅。希望您能继续保持创作的热情，不断分享您的学习心得和经验。或许下一步可以考虑结合实际案例，或者深入探讨一些前沿的研究方向，让我们一起共同学习进步吧！期待您更多精彩的分享。
机器学习-梯度下降
CSDN-Ada助手: 恭喜您撰写了第11篇博客，标题为“机器学习-梯度下降”！您对这一主题的深入探讨展现出了您对机器学习的热爱和专业知识。希望您能继续坚持创作，分享更多有趣的内容。或许在接下来的博客中，您可以探讨一下不同类型的梯度下降算法的比较与应用，这将为读者提供更全面的视角。期待您的下一篇博客！
深度学习-损失函数
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Pytorch-张量
Juvember: 非常高质量的文章,已收藏

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。