激活函数（4种）

NNothing丶

已于 2023-04-20 17:55:40 修改

阅读量127

点赞数

分类专栏：神经网络 Tensorflow 文章标签：机器学习 python 神经网络

于 2023-04-20 17:50:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39014212/article/details/130271785

版权

Tensorflow 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

4 篇文章 1 订阅

订阅专栏

文章比较了sigmoid、tanh、ReLU及其变种LeakyReLU的优缺点。sigmoid和tanh存在梯度消失问题，而ReLU解决了这一问题但可能导致死区。LeakyReLU试图改进ReLU的死区问题，但在实践中并不总是优于ReLU。推荐使用ReLU并配合合适的初始化策略和学习率来优化训练过程。

摘要由CSDN通过智能技术生成

sigmoid函数

tf.nn.sigmoid(x)

特点：

易造成梯度消失。
输出非0均值，收敛慢。
幂运算复杂，训练时间长。

Tanh函数

tf.math.tanh(x)

特点：

输出是0均值。
易造成梯度消失
幂运算复杂，训练时间长。

Relu函数

tf.nn.relu(x)

优点：

解决了梯度消失问题（在正区间）
只需判断输入是否大于0，计算速度快。
收敛速度远快于sigmoid和tanh

缺点：

输出非0均值，收敛慢。
Dead ReIU问题：某些神经元可能永远不会被激活，导致相应的参数永远不能被更新。

解决缺点：（减少负数特征）

改进随机初始化。
设置更小的学习率，减少参数分布的巨大变化，避免训练中产生过多的负数特征。

Leaky Relu函数

tf.nn.leaky_relu(x)

理论上讲，Leaky Relu有Relu的所有优点，外加不会有Dead Relu问题。但是在实际操作中，并没有完全证明Leaky Relu总好于Relu.

对于激活函数选择：

首选relu激活函数
学习率设置较小值
输入特征标准化，即让输入特征满足以0为均值，1为标准差的正态分布。
初始参数中心化，即让随机生成的参数满足以0为均值， $\large \sqrt{\frac{2}{features}}$ （当前层输入特征个数）为标准差的正态分布。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。