如何选择最后一层激活和损失函数--python深度学习

Yvonne-陈

于 2023-06-03 23:27:48 发布

阅读量276

点赞数 1

分类专栏：《python深度学习》笔记文章标签：深度学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_46726459/article/details/131027005

版权

8 篇文章 0 订阅

订阅专栏

基于keras深度学习中，如何选择最后一层激活和损失函数？

在这里插入图片描述

（1）sigmoid
在这里插入图片描述

在什么情况下适合使用 Sigmoid 激活函数？

缺点

（2）ReLU
在这里插入图片描述

ReLU函数其实就是一个取最大值函数，注意这并不是全区间可导的，但是我们可以取sub-gradient，如上图所示。ReLU虽然简单，但却是近几年的重要成果，有以下几大优点：

解决了gradient vanishing问题 (在正区间)
Sigmoid和Tanh激活函数均需要计算指数，复杂度高，而ReLU只需要一个阈值即可得到激活值。ReLU 函数中只存在线性关系，因此它的计算速度比 sigmoid 和 tanh 更快。计算速度非常快，只需要判断输入是否大于0。
收敛速度远快于sigmoid和tanh
ReLU的非饱和性可以有效地解决梯度消失的问题，提供相对宽的激活边界。
ReLU的单侧抑制提供了网络的稀疏表达能力。

（3）Softmax
在这里插入图片描述

Softmax 是用于多类分类问题的激活函数，在多类分类问题中，超过两个类标签则需要类成员关系。对于长度为 K 的任意实向量，Softmax 可以将其压缩为长度为 K，值在（0，1）范围内，并且向量中元素的总和为 1 的实向量。

Softmax 激活函数的主要缺点是：

关注