必能读懂的交叉熵详解，pytorch中交叉熵的使用

最新推荐文章于 2024-05-13 23:20:43 发布

Leri_X

最新推荐文章于 2024-05-13 23:20:43 发布

阅读量2.4k

点赞数 4

分类专栏： pytorch 深度学习文章标签： pytorch 深度学习神经网络

本文链接：https://blog.csdn.net/Defiler_Lee/article/details/104803208

版权

pytorch 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

深度学习

5 篇文章 0 订阅

订阅专栏

我们知道交叉熵的值可以表示两个概率分布的相似程度，它可以作为多分类训练的损失函数，并且就像刚刚举的例子，神经网络所预测的概率往往是例如 [0, 1, 0]的，而且目标值往往是如同 [0, 1, 0] 的分布，接下来我们讲解这样的分布在深度学习中的应用。

2. 交叉熵的应用（pytorch中）

2.1 交叉熵在分类任务中的计算过程

这里我们按照之前举的例子：

	x1	x2	x3
q (Pred)	0.1	0.2	0.7
p (Label)	0	1	0

那么我们按照交叉熵，进行计算，

loss = - ( 0 * log(0.1) + 1 * log(0.2) + 0 * log(0.7) )

= - log( 0.2 )

也就是说，我们只需要计算label是1的那部分，这里假设目标分类结果是xi类，那么我们只需要计算 -log(p(xi)) 即可。

2.2 log_softmax()函数

首先我们需要了解什么是softmax函数，这里可以查看我的这篇博客：softmax 简单讲解

我们通过softmax()，可以得出总和为1的概率分布，经过log运算，我们其实就得出了log(p(xi))，取反即可得出交叉熵。

举个例子：

2.3 nll_loss()函数

由之前我们推出的，我们只需要计算分类xi概率，进行log运算，所得的值就可以表示交叉熵并作为loss值（有点绕。。），

（总之就是如果预测值Pred是 [0.1, 0.2, 0.7] ，然后实际上的分类是第二类，那么我们只需要计算第二个的概率的log值

即 log(0.2) ）

实际上，我们往往会同时对多个样本进行训练，这样得出的Pred往往是二维的，例如我们进行图片分类，假设 x_input 是最后一层的输出，其中（3，5）表示每次有 3 张图片需要进行分类，分类总共有五种，比如分别是ABCDE五个字母，然后我们使用softmax将输出的数值，转化为总和为1的概率分布（每行的和为1）：