Softmax函数与交叉熵

最新推荐文章于 2025-07-30 08:48:53 发布

原创

最新推荐文章于 2025-07-30 08:48:53 发布 · 4.5w 阅读

·

70

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#tensorflow #交叉熵 #softmax

Softmax函数
Loss function
TensorFlow
总结
Reference

Softmax函数

背景与定义

在Logistic regression二分类问题中，我们可以使用sigmoid函数将输入 $Wx + b$ 映射到 $(0, 1)$ 区间中，从而得到属于某个类别的概率。将这个问题进行泛化，推广到多分类问题中，我们可以使用softmax函数，对输出的值归一化为概率值。

这里假设在进入softmax函数之前，已经有模型输出 $C$ 值，其中 $C$ 是要预测的类别数，模型可以是全连接网络的输出 $a$ ，其输出个数为 $C$ ，即输出为 $a_{1}, a_{2}, ..., a_{C}$ 。

所以对每个样本，它属于类别 $i$ 的概率为：

y i = e a i \sum C k = 1 e a k \forall i \in 1... C

$y_{i} = \frac{e^{a_i}}{\sum_{k=1}^{C}e^{a_k}} \ \ \ \forall i \in 1...C$

通过上式可以保证 $\sum_{i=1}^{C}y_i = 1$ ，即属于各个类别的概率和为1。

导数

对softmax函数进行求导，即求

\partial y i \partial a j

$\frac{\partial{y_{i}}}{\partial{a_{j}}}$
第

i $i$ 项的输出对第

j $j$ 项输入的偏导。
代入 softmax函数表达式，可以得到：

\partial y i \partial a j = \partial e a i \sum C k = 1 e a k \partial a j

$\frac{\partial{y_{i}}}{\partial{a_{j}}} = \frac{\partial{ \frac{e^{a_i}}{\sum_{k=1}^{C}e^{a_k}} }}{\partial{a_{j}}}$

用我们高中就知道的求导规则：对于

f (x) = g ( x ) h ( x )

$f(x) = \frac{g(x)}{h(x)}$
它的导数为

f' (x) = g ' ( x ) h ( x ) - g ( x ) h ' ( x ) [ h ( x ) ] 2

$f'(x) = \frac{g'(x)h(x) - g(x)h'(x)}{[h(x)]^2}$
所以在我们这个例子中，

g (x) = e a i h (x) = \sum k = 1 C e a k

$g(x) = e^{a_i} \\ h(x) = \sum_{k=1}^{C}e^{a_k}$
上面两个式子只是代表直接进行替换，而非真的等式。

$e^{a_i}$ （即 $g(x)$ ）对 $a_j$ 进行求导，要分情况讨论：
1. 如果 $i = j$ ，则求导结果为 $e^{a_i}$
2. 如果 $i \ne j$ ，则求导结果为 $0$

再来看 $\sum_{k=1}^{C}e^{a_k}$ 对 $a_j$ 求导，结果为 e

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄8年

2
原创

74
点赞

85
收藏

38
粉丝

关注

私信

热门文章

分类专栏

下一篇：: CTR、推荐系统学习路线

最新评论

Softmax函数与交叉熵
Mingsheng Zhang 回复 mwsmwsmws: 对，算完之后取平均值
Softmax函数与交叉熵
ncc1995: 非常棒啦，找了很久才找到一篇解释这么好的
Softmax函数与交叉熵
dawningblue: 我主要是查找softmax回归的损失函数是如何通过交叉熵来推导出来的，看完您的文章以后我懂了，非常感谢博主写这么一篇文章要花不少时间吧
Softmax函数与交叉熵
mwsmwsmws: 写的很好，只是有点疑问，在交叉熵对所有的样本，我们有以下loss function：严谨一些，这里应该取平均值吧
Softmax函数与交叉熵
ggegehat2355gargfs 回复 behamcheung: 懂了，谢谢楼主

大家在看

最新文章

CTR、推荐系统学习路线

目录

展开全部

收起

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。