tensorflow学习之softmax使用详解

最新推荐文章于 2024-08-08 16:38:28 发布

大雄没有叮当猫

最新推荐文章于 2024-08-08 16:38:28 发布

阅读量2.6w

点赞数 7

分类专栏：深度学习机器学习 tensorflow

本文链接：https://blog.csdn.net/u013230189/article/details/82835717

版权

深度学习同时被 3 个专栏收录

54 篇文章 2 订阅

订阅专栏

机器学习

49 篇文章 2 订阅

订阅专栏

tensorflow

34 篇文章 0 订阅

订阅专栏

1. 什么是Softmax

Softmax 在机器学习和深度学习中有着非常广泛的应用。尤其在处理多分类（C > 2）问题，分类器最后的输出单元需要Softmax 函数进行数值处理。关于Softmax 函数的定义如下所示：

其中，Vi 是分类器类别的输出。i 表示类别索引，总的类别个数为 C。Si 表示的是当前元素的指数与所有元素指数和的比值。Softmax 将多分类的输出数值转化为相对概率，更容易理解和比较。我们来看下面这个例子。一个多分类问题，C = 4。线性分类器模型最后输出层包含了四个输出值，分别是：

经过Softmax处理后，数值转化为相对概率：

很明显，Softmax 的输出表征了不同类别之间的相对概率。我们可以清晰地看出，S1 = 0.8390，对应的概率最大，则更清晰地可以判断预测为第1类的可能性更大。Softmax 将连续数值转化成相对概率，更有利于我们理解。实际应用中，使用 Softmax 需要注意数值溢出的问题。因为有指数运算，如果 V 数值很大，经过指数运算后的数值往往可能有溢出的可能。所以，需要对 V 进行一些数值处理：即 V 中的每个元素减去 V 中的最大值.

2. Softmax 损失函数

我们知道，线性分类器的输出是输入 x 与权重系数的矩阵相乘：s = Wx。对于多分类问题，使用 Softmax 对线性输出进行处理。这一小节我们来探讨下 Softmax 的损失函数。

其中，Syi是正确类别对应的线性得分函数，Si 是正确类别对应的 Softmax输出。由于 log 运算符不会影响函数的单调性，我们对 Si 进行 log 操作：

我们希望 Si 越大越好，即正确类别对应的相对概率越大越好，那么就可以对 Si 前面加个负号，来表示损失函数：

对上式进一步处理，把指数约去：

这样，Softmax 的损失函数就转换成了简单的形式。举个简单的例子，上一小节中得到的线性输出为：

假设 i = 1 为真实样本，计算其损失函数为：

3.tensorflow api

import tensorflow as tf

s=tf.constant([1,1,2,3,4,5,10],dtype=tf.float32)

sm=tf.nn.softmax(s)

with tf.Session()as sess:

    print(sess.run(sm))

    print(sess.run(tf.argmax(sm)))