交叉熵损失函数的应用

ad转化器

已于 2024-03-15 11:24:23 修改

阅读量355

点赞数

分类专栏： # 深度学习基础知识文章标签：深度学习

于 2022-07-04 22:51:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gqrblnp/article/details/125609800

版权

深度学习基础知识专栏收录该内容

4 篇文章 0 订阅

订阅专栏

交叉熵损失函数原理详解

0.关于标签的理解

MNIST手写数字识别数据集，每张图片只能有一个固定的标签“数字”，即每张照片都是数字；

若一张图片中同时含有“猫”和“狗”，这张图片就同时拥有属于“猫”和“狗”的两种标签；

可以看出，标签就是一张图片的属性

1.单标签分类任务中的使用（二分类任务包含在其中）

参考：交叉熵在单标签分类任务中的使用

需要注意的是：

（1）单标签含有的类别较多（MNIST手写数字识别数据集，分成数字0-9），一般用softmax函数作为网络最后一层的输出

（2）对单个样本，假设真实分布为 $y$ ，网络输出分布为 $\widehat{y}$ ，总的类别数为 $n$ ，则在这种情况下，交叉熵损失函数的计算方法为：

$Loss=-\sum_{i=1}^{n}y_{i}\log \widehat{y_{i}}$

对于二分类问题， $n=2$ ，这种情况下也是利用上面的交叉熵损失函数，即： $Loss=-\sum_{i=1}^{n}y_{i}\log \widehat{y_{i}}=-y_{1}\log \widehat{y_{1}}-y_{2}\log \widehat{y_{2}}=-y\log \widehat{y}-(1-y)\log (1-\widehat{y})$

说明了公式 $Loss=-\sum_{i=1}^{n}y_{i}\log \widehat{y_{i}}$ 的统一性

2.多标签分类任务中的使用

参考：交叉熵在多标签分类任务中的使用

需要注意的是：

（1）多标签的每一个标签相当于是二分类问题，所以用sigmoid函数作为网络最后一层的输出

（2）在第1节（单标签分类任务中的使用）中，对一个batch，单标签n分类任务的交叉熵损失函数的计算方法为：

$Loss=-\frac{1}{batch\_size}\sum_{j=1}^{batch\_size}\sum_{i=1}^{n}y_{ji}\log\widehat{y_{ji}}$

这里，若 $y_{ji}\neq0$ （ $y_{ji}=1$ ）的分量才保留（ $y_{ji}$ 只能为 $0/1$ ）

在本节（多标签分类任务中的使用）中，对一个batch，多标签n分类（n其实就是2）任务的交叉熵损失函数的计算方法为：

$Loss=\frac{1}{batch\_size}\sum_{j=1}^{batch\_size}\sum_{i=1}^{n}-y_{ji}\log\widehat{y_{ji}}-(1-y_{ji})\log(1-\widehat{y_{ji}})$

这里， $y_{ji}=0/1$ 计算得到的分量均保留（ $y_{ji}$ 只能为 $0/1$ ）

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
交叉熵损失函数的应用

交叉熵损失函数的应用
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。