交叉熵

最新推荐文章于 2023-02-21 17:31:23 发布

qq_26697045

最新推荐文章于 2023-02-21 17:31:23 发布

阅读量365

点赞数

分类专栏：深度学习基础s

本文链接：https://blog.csdn.net/qq_26697045/article/details/103966064

版权

深度学习基础s 专栏收录该内容

64 篇文章 0 订阅

订阅专栏

交叉熵

1. 交叉熵
2. 计算方法
3. Tensorflow计算交叉熵
4. Pytorch计算交叉熵

1. 交叉熵

假如网络是一个3分类任务，网络的输出 $l o g i t s = [3, 1, - 3]$ 表示分为每一类的可能性大小：3表示归为标签0(3的下标)的可能性；1表示归为标签1(1的下标)的可能性；-3表示归为标签2(-3的下标)的可能性。因为3最大，所以归为标签0的可能最大，对应的损失应该最小。

2. 计算方法

假设 $logits=[y_1,y_2,y_3]$ 。
$\frac{exp(y_1)}{\sum_{i=1}^{3} exp(y_i)}, \quad \frac{exp(y_2)}{\sum_{i=1}^{3} exp(y_i)}, \quad \frac{exp(y_3)}{\sum_{i=1}^{3} exp(y_i)}]$ 。
$log\_soft=[- \ln \frac{exp(y_1)}{\sum_{i=1}^{3} exp(y_i)}, \quad -\ln \frac{exp(y_2)}{\sum_{i=1}^{3} exp(y_i)}, \quad -\ln \frac{exp(y_3)}{\sum_{i=1}^{3} exp(y_i)}]$ 。
$l a b e l s$ 比 $l o g i t s$ 少一个维度，表示实际的类别。比如 $l a b e l s = 0$ ，则 $loss=log\_soft[0]$ 。

3. Tensorflow计算交叉熵

import tensorflow as tf
import math
import os
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "2"
 
batch_size = 1
num_classes = 3
logits = tf.constant([3, 1, -3], shape=[batch_size, num_classes], dtype=tf.float32)
labels = tf.constant([0], shape=[batch_size,], dtype=tf.int32)

with tf.Session() as sess:
	softmax = tf.nn.softmax(logits)
	print"--softmax: ", softmax.eval()
	log_soft = [-math.log(i) for i in softmax.eval()[0]]
	print"--1: ", log_soft
 
	print"--2: ", tf.losses.sparse_softmax_cross_entropy(logits=logits, labels=labels).eval()
 
	temp = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits, labels=labels)
	print"--3: ", tf.reduce_mean(temp).eval()

说明：

第12行计算 $soft\_max$ 。
第14行计算 $log\_soft$ 。 $log\_soft[i]$ ：对应标签 $i$ 的损失。
第17行计算交叉熵。计算的结果和 $log\_soft[labels]$ 一样。

4. Pytorch计算交叉熵

import torch
from torch.autograd import Variable

logits = Variable(torch.Tensor([[3, 1, -3]]))
labels = Variable(torch.LongTensor([0]), requires_grad=False)
loss = torch.nn.functional.cross_entropy(logits, labels)
print loss