Tensorflow常见激活函数 -- Tensorflow自学笔记10

青瓷看世界

已于 2024-09-03 11:56:45 修改

阅读量608

点赞数 9

文章标签： tensorflow 人工智能 python

于 2024-09-01 21:51:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pisceshsu/article/details/141789183

版权

激活函数激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。

一. 什么是优秀的激活函数？

优秀的激活函数应满足:

1. 非线性:

激活函数非线性时，多层神经网络可逼近所有函数

2. 可微性

优化器大多用梯度下降更新参数

3. 单调性

当激活函数是单调的，能保证单层网络的损失函数是凸函数

4. 近似恒等性

f(x)约等于x. 当参数初始化为随机小值时，神经网络更稳定

5. 激活函数输出值的范围:
1) 激活函数输出为有限值时，基于梯度的优化方法更稳定

2) 激活函数输出为无限值时，建议调小学习率

二. 常见的激活函数

常见的激活函数有

3.1 sigmoid

TensorFlow API: tf.math.sigmoid

优点:

1. 输出映射在(0,1)之间，单调连续，输出范围有限，优化稳定，可用作输出层;

2. 求导容易。

缺点:

1. 易造成梯度消失;
2. 输出非0均值，收敛慢;
3. 幂运算复杂，训练时间长。

sigmoid函数可应用在训练过程中。然而，当处理分类问题作出输出时，sigmoid却无能为力。简单地说，sigmoid函数只能处理两个类，不适用于多分类问题。而softmax可以有效解决这个问题，并且softmax函数大都运用在神经网路中的最后一层网络中，使得值得区间在(0,1)之间，而不是二分类的。

3.2 tanh

TensorFlow API: tf.math.tanh

优点:

1. 比sigmoid函数收敛速度更快。
2. 相比sigmoid函数，其输出以0为中心。

缺点

1. 易造成梯度消失;

2. 幂运算复杂，训练时间长。

3.3 ReLU

TensorFlow API: tf.nn.relu

优点

1. 解决了梯度消失问题(在正区间);
2. 只需判断输入是否大于0，计算速度快;
3. 收敛速度远快于sigmoid和tanh，因为sigmoid和tanh涉及很多expensive的操作;

4. 提供了神经网络的稀疏表达能力。

缺点：

1. 输出非0均值，收敛慢;

2. Dead ReLU问题:某些神经元可能永远不会被激活，导致相应的参数永远不能被更新。

3.4 Leaky ReLU

TensorFlow API: tf.nn.leaky_relu

理论上来讲，Leaky ReLU有ReLU的所有优点，外加不会有Dead ReLU问题，但是在实际操作当

中，并没有完全证明Leaky ReLU总是好于ReLU。

3.5 softmax

TensorFlow API: tf.nn.softmax

对神经网络全连接层输出进行变换，使其服从概率分布，即每个值都位于[0,1]区间且和为1。

3.6 建议

对初学者的的建议：

1. 首选ReLU激活函数;

2. 学习率设置较小值;

3. 输入特征标准化，即让输入特征满足以0为均值，1为标准差的正态分布;

4. 初始化问题:初始参数中心化，即让随机生成的参数满足以0为均值，为标准差的正态分布。

青瓷看世界

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

青瓷看世界 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。