【深度学习】softmax和交叉熵的配合求导

DonngZH

已于 2023-11-14 08:45:04 修改

阅读量9.1k

点赞数 9

分类专栏：人工智能深度学习文章标签：深度学习机器学习神经网络

于 2023-03-02 15:57:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44750512/article/details/129185574

版权

深度学习同时被 2 个专栏收录

75 篇文章

订阅专栏

53 篇文章

订阅专栏

在分类问题中，尤其是在神经网络中，交叉熵函数非常常见。因为经常涉及到分类问题，需要计算各类别的概率，所以交叉熵损失函数与sigmoid函数或者softmax函数成对出现。

1.softmax

softmax用于多分类过程中，它将多个神经元的输出，映射到（0,1）区间内的概率，进行多分类。

假设一个数组V，一共有j个元素Vi表示V中的第i个元素，第i个元素的softmax值公式如下。

softmax和交叉熵结合，因为交叉熵的输入是概率，而softmax就可以把网络的输出变成对应等比例的概率。

2.交叉熵损失函数(Cross Entropy Error Function)

1. 二分类的交叉熵损失函数形式

2.多分类的交叉熵损失函数形式

3.softmax 求导

3-1 求s1对x1的导数

3-2 求s1对x2的导数

特别注意：因为在计算softmax时候，分母中用到了所有的X，分母包括了 $e^{x1}$ ， $e^{x2}$ ，……， $e^{xj}$ ，所以任何一个输出节点 $S_{i}$ 都要对所有x 进行求导。以求 s1 对 x2 的导数为例，过程如下

3-3 softmax 的导数

所以可以得到，i=j 时和 i 不等于 j 时的 softmax导数。

注意区分：i是softmax之后得到s的下标，j是进入softmax之前x的下标，注意区分，可以看3-1和3-2的实例进行理解。

4.softmax和交叉熵损失

4-1 计算过程

分类任务中搭建神经网络时，交叉熵损失函数经常与softmax配合使用，假设有以下三个向量。

向量𝑦(为one-hot编码,只有一个值为1,其他的值为0)真实类别标签(维度为𝑚,表示有𝑚类别)：

向量𝑧为softmax函数的输入，和标签向量𝑦的维度一样，为𝑚：

向量𝑠为softmax函数的输出，和标签向量𝑦的维度一样，为𝑚：

交叉熵损失函数具体计算公式如下

损失函数对向量𝑧z中的每个𝑧𝑖求偏导：

需计算i等于j和i不等于j的加和，最后的计算结果如下：

4-2 实例

通过计算最后得到的某个训练样本的向量的分数是[1,2,3], 经过softmax函数作用后

假设正确的分类结果是那么计算出来的偏导就是（保留三位有效数字）[0.090-0，0.245-1，0.665-0]=[0.090，-0.755，0.665]。

由计算结果可见，softmax和交叉熵结合之后求导，就是softmax之后的结果减去对应的y值，由此进行反向传播。

Reference

1.https://www.cnblogs.com/smallredness/p/11047718.html

2.安全验证 - 知乎

博客等级

码龄6年

176
原创

1156
点赞

5065
收藏

605
粉丝

关注

私信

热门文章

分类专栏

人工智能 53篇
深度学习 75篇
机器学习 21篇
机器翻译 1篇
剑指offer 28篇
Linux 6篇
Django 8篇
Fabric2.0部署 6篇

最新评论

【深度学习、工程实践】关系抽取Casrel实现(Pytorch版)
qq_44972014: 请问博主这个数据集是百度什么数据集名称，这是duie1.0还是2.0
【比赛记录】国电投-光伏电站人工智能运维大数据处理分析比赛
tianxinmeiwenye: 博主您好，球球这个数据集呢
【深度学习】Multi-Head Attention 原理与代码实现
跃动的世界线: 对啊，每个头都要有额外的qkv，最后还有一个全连接
【深度学习、工程实践】关系抽取Casrel实现(Pytorch版)
lnjia: 博主，有没有CasRel模型本地部署的过程，以及实体关系抽取、模型评价的操作过程，万分感谢
【工程实践】logging
北风之神c: 总结的很全面的日志使用，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。