PyTorch 中的交叉熵函数 CrossEntropyLoss 的计算过程

最新推荐文章于 2024-06-22 22:41:08 发布

随风秀舞

最新推荐文章于 2024-06-22 22:41:08 发布

阅读量1w

点赞数 17

分类专栏：人工智能/深度学习/机器学习文章标签： PyTorch 交叉熵神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jasonleesjtu/article/details/89141554

版权

CrossEntropyLoss() 函数联合调用了 nn.LogSoftmax() 和 nn.NLLLoss()。

假设网络得到的输出为 $h$ ，它的维度大小为 $B\times C$ ，其中 $B$ 是 batch_size， $C$ 是分类的总数目。与之对应的训练数据的标签 $y$ 维度是 $1\times B$ ， $y$ 中元素的取值范围是 $[0, C - 1]$ ，即
$0\le y[j]\le C-1 \qquad j = 0, 1, \cdots, B-1$

我们将CrossEntropyLoss() 函数的计算过程拆解为如下两个步骤：

对输出 $h$ ，执行LogSoftmax(dim=1)，得到 $s$ ，维度仍然是 $B\times C$ 。
对 $s$ 执行 $-\log()$ 操作，得到负对数概率 $p$ ，维度仍然是 $B\times C$ 。

则交叉熵的计算公式为：
$\frac{1}{B}\sum_{i=0}^B\left\{-\log(p[i,y[i]])\right\} \tag{1}$

式(1)其实是从式(2)化简得来的：
$\frac{1}{B}\sum_{i=0}^B\left\{-\sum_{j=0}^{C-1}y[i, j]\log(p[i,j])\right\} \tag{2}$

最低0.47元/天解锁文章

关注

17
点赞
踩
26

收藏

觉得还不错? 一键收藏
4
评论
PyTorch 中的交叉熵函数 CrossEntropyLoss 的计算过程

CrossEntropyLoss() 函数联合调用了 nn.LogSoftmax() 和 nn.NLLLoss()。假设网络得到的输出为 hhh，它的维度大小为 B×CB\times CB×C，其中 BBB 是 batch_size，CCC 是分类的总数目。与之对应的训练数据的标签 yyy 维度是 1×B1\times B1×B，yyy 中元素的取值范围是 [0,C−1][0, C-1][0,C...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。