softmax 详解

最新推荐文章于 2024-06-11 16:43:37 发布

Vic_Hao

最新推荐文章于 2024-06-11 16:43:37 发布

阅读量706

点赞数 1

分类专栏：机器学习

机器学习专栏收录该内容

11 篇文章 9 订阅

订阅专栏

什么是softmax

softmax函数定义如下：
$S_i=\frac {e^{V_i}}{\sum_{i}^{C}e^{V_i}}$
where
$V_i$ ------分类器前级输出单元的输出
$i$ ------类别索引
$C$ ------总的类别个数
softmax将多分类的输出数值转化为相对概率，更容易理解和比较。

例子：
一个多分类问题， $C = 4$ 。线性分类器模型最后输出层包含四个输出值，分别是：
$V=\begin{bmatrix}-3\\ 2\\ -1\\ 0\\\end{bmatrix}$
经过softmax处理后，数值转化为相对概率:
$V=\begin{bmatrix}0.0057\\ 0.8390\\ 0.0418\\ 0.1135\\\end{bmatrix}$

很明显，Softmax 的输出表征了不同类别之间的相对概率。我们可以清晰地看出， $S_1 = 0.8390$ ，对应的概率最大，则更清晰地可以判断预测为第1类的可能性更大。Softmax 将连续数值转化成相对概率，更有利于我们理解。

实际应用中，使用 softmax 需要注意数值溢出的问题。因为有指数运算，如果 $V$ 数值很大，经过指数运算后的数值往往可能有溢出的可能。所以，需要对 $V$ 进行一些数值处理：即 $V$ 中的每个元素减去 $V$ 中的最大值。

$D = m a x (V)$
$S_i=\frac {e^{V_i-D}}{\sum_{i}^{C}e^{V_i-D}}$

相应的python程序：

scores = np.array([123, 456, 789])    # example with 3 classes and each having large scores
scores -= np.max(scores)    # scores becomes [-666, -333, 0]
p = np.exp(scores) / np.sum(np.exp(scores))

Reference:
https://blog.csdn.net/raojunyang/article/details/81194793

Vic_Hao

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
softmax 详解

什么是softmaxsoftmax函数定义如下：Si=eVi∑iCeViS_i=\frac {e^{V_i}}{\sum_{i}^{C}e^{V_i}}Si=∑iCeVieViwhereViV_iVi------分类器前级输出单元的输出iii------类别索引CCC------总的类别个数softmax将多分类的输出数值转化为相对概率，更容易理解和比较。例子：一个多...
复制链接

扫一扫