TensorFlow：输出层设计

最新推荐文章于 2023-04-14 11:35:10 发布

南淮北安

最新推荐文章于 2023-04-14 11:35:10 发布

阅读量1.3k

点赞数 1

分类专栏： TensorFlow 学习文章标签： tensorflow

本文链接：https://blog.csdn.net/nanhuaibeian/article/details/103768779

版权

TensorFlow 学习专栏收录该内容

56 篇文章 24 订阅

订阅专栏

我们来特别地讨论网络的最后一层的设计，它除了和所有的隐藏层一样，完成维度变
换、特征提取的功能，还作为输出层使用，需要根据具体的任务场景来决定是否使用激活
函数，以及使用什么类型的激活函数。

我们将根据输出值的区间范围来分类讨论。常见的几种输出类型包括：
在这里插入图片描述

文章目录

一、普通实数空间

这一类问题比较普遍，像正弦函数曲线预测、年龄的预测、股票走势的预测等都属于整个或者部分连续的实数空间，输出层可以不加激活函数。
误差的计算直接基于最后一层的输出𝒐和真实值y 进行计算，如采用均方差误差函数度量输出值𝒐与真实值𝒚之间的距离：
在这里插入图片描述

二、[0,1] 区间

输出值属于[0, 1]区间也比较常见，比如图片的生成，二分类问题等。在机器学习中，一般会将图片的像素值归一化到[0,1]区间，如果直接使用输出层的值，像素的值范围会分布在整个实数空间。为了让像素的值范围映射到[0,1]的有效实数空间，需要在输出层后添加某个合适的激活函数𝜎，其中Sigmoid 函数刚好具有此功能。

同样的，对于二分类问题，如硬币的正反面的预测，输出层可以只需要一个节点，表示某个事件A 发生的概率P(𝐴|𝑥)。如果我们把网络的输出o表示正面事件出现的概率，那么反面事件出现的概率即为1 − 𝑜，网络结构如图所示：
在这里插入图片描述

三、[0,1] 区间，和为 1

在这里插入图片描述
输出值𝑜𝑖 ∈ [0,1]，所有输出值之和为1，这种设定以多分类问题最为常见。如上图所示，输出层的每个输出节点代表了一种类别，图中网络结构用于处理3 分类任务，3 个节点的输出值分布代表了当前样本属于类别A，类别B，类别C 的概率P(A|x), P(B|x), P(C|x)，考虑多分类问题中的样本只可能属于所有类别中的某一种，因此满足所有类别概率之和为1 的约束。

如何实现此约束逻辑呢？可以通过在输出层添加Softmax 函数实现。Softmax 函数定义
为
在这里插入图片描述
Softmax 函数不仅可以将输出值映射到[0,1]区间，还满足所有的输出值之和为1 的特性。
如下图中的例子，输出层的输出为[2. ,1. ,0.1]，经过Softmax 函数计算后，得到输出为
[0.7,0.2,0.1]，可以看到每个值代表了当前样本属于每个类别的概率，概率值之和为1。
通过Softmax 函数可以将输出层的输出转译为类别概率，在分类问题中使用的非常频繁。
在这里插入图片描述
在 TensorFlow 中，可以通过tf.nn.softmax 实现Softmax 函数：

z = tf.constant([2.,1.,0.1])
tf.nn.softmax(z) # 通过Softmax 函数

与Dense 层类似，Softmax 函数也可以作为网络层类使用，通过 layers.Softmax(axis=-1)可以方便添加Softmax 层，其中axis 参数指定需要进行计算的维度。

在 Softmax 函数的数值计算过程中，容易因输入值偏大发生数值溢出现象；在计算交
叉熵时，也会出现数值溢出的问题。为了数值计算的稳定性，TensorFlow 中提供了一个统一的接口，将Softmax 与交叉熵损失函数同时实现，同时也处理了数值不稳定的异常，一般推荐使用，避免单独使用Softmax 函数与交叉熵损失函数。
函数式接口为tf.keras.losses.categorical_crossentropy(y_true, y_pred, from_logits=False)，其中y_true 代表了one-hot 编码后的真实标签，y_pred 表示网络的预测值，当from_logits 设置为True 时，y_pred 表示须为未经过Softmax 函数的变量z；当from_logits 设置为False 时，y_pred 表示为经过Softmax 函数的输出。

z = tf.random.normal([2,10]) # 构造输出层的输出
y_onehot = tf.constant([1,3]) # 构造真实值
y_onehot = tf.one_hot(y_onehot, depth=10) # one-hot 编码
# 输出层未使用Softmax 函数，故from_logits 设置为True
loss = keras.losses.categorical_crossentropy(y_onehot,z,from_logits=True)
loss = tf.reduce_mean(loss) # 计算平均交叉熵损失

也可以利用losses.CategoricalCrossentropy(from_logits)类方式同时实现Softmax 与交叉熵损失函数的计算：

criteon = keras.losses.CategoricalCrossentropy(from_logits=True)
loss = criteon(y_onehot,z) # 计算损失

四、[-1,1]

如果希望输出值的范围分布在[−1, 1]，可以简单地使用tanh 激活函数，实现如下

x = tf.linspace(-6.,6.,10)
tf.tanh(x) # tanh 激活函数

南淮北安

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
TensorFlow：输出层设计

我们来特别地讨论网络的最后一层的设计，它除了和所有的隐藏层一样，完成维度变换、特征提取的功能，还作为输出层使用，需要根据具体的任务场景来决定是否使用激活函数，以及使用什么类型的激活函数。我们将根据输出值的区间范围来分类讨论。常见的几种输出类型包括：文章目录一、普通实数空间二、[0,1] 区间三、[0,1] 区间，和为 1四、[-1,1]一、普通实数空间这一类问题比较普遍，像正弦函数曲...
复制链接

扫一扫