什么是softmax函数？

卡哇斯基

已于 2022-02-24 12:35:30 修改

阅读量1.2k

点赞数

文章标签：深度学习计算机视觉

于 2022-02-24 09:12:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51567891/article/details/123102144

版权

背景

当我们在做多分类问题（multi-classification）时，如果我们的卷积神经网络没有softmax函数，仅仅是linear层和激活函数（如sigmoid），那么我们的输出就是一些预测值 $\hat{y_1},\hat{y_2},\dots,\hat{y_n}$ 。但是在多分类问题中，我们希望得到的是关于这 $n$ 个种类的一个分布（distribution） $P(y_1),\dots,P(y_n),\text{ such\ that\ }\sum P(y_i) = 1$ ，这样我们就可以预测样本到底属于哪一类了，比如MNIST分类中，我们想知道某张图片的预测结果是数字几。这就需要softmax函数。

softmax layer

softmax层的核心就是softmax函数：
$\frac{e^z_i}{\sum_{j=0}^n e^z_j},\text{where }i=0,\dots,n-1$
这里的 $z$ 就是上文所说的 $\hat{y}$ 。

CrossEntropyLoss

在完成softmax函数的计算后，把所得的结果取对数 $\log$ ，用来计算损失（loss）。我们所用的损失函数是NILLoss(negative log likelihood loss)，即
$-Y\log \hat{Y}$ 其中， $Y$ 是样本的label，即真实值。

结合上文所述，对于softmax函数和cross entropy loss的关系，不难发现
$C r o s s E n t r o p y L o s s = L o g S o f t m a x + N I L L o s s$

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。