tensorflow笔记 cross entropy loss

最新推荐文章于 2022-08-13 14:13:37 发布

thormas1996

最新推荐文章于 2022-08-13 14:13:37 发布

阅读量1.8k

点赞数

分类专栏：代码笔记文章标签： tensorflow 交叉熵

本文链接：https://blog.csdn.net/thormas1996/article/details/95078416

版权

这篇博客详细介绍了在TensorFlow中如何使用sigmoid_cross_entropy_with_logits和tf.keras.backend.binary_crossentropy计算交叉熵损失。文章通过公式推导解释了这两个函数的工作原理，并强调了它们在输入上的差异。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

交叉熵损失函数是模型中非常常见的一种损失函数，tensorflow中有一个计算交叉熵的函数：tf.nn.sigmoid_cross_entropy_with_logits，也可以调用keras中的函数： tf.keras.backend.binary_crossentropy，需要注意的是两者的输入有一些不同。

先来看看tf自带的sigmoid_cross_entropy_with_logits：

tf.nn.sigmoid_cross_entropy_with_logits(
    _sentinel=None,
    labels=None,
    logits=None,
    name=None
)

sigmoid_cross_entropy_with_logits()需要两个参数，神经网络最后一层的输出logits和真实值labels。内部会经过一次sigmoid再计算cross entropy loss，计算方式如下所示：

令x = logits, z = labels
Loss = - z * log(sigmoid(x)) - (1 - z) * log(1 - sigmoid(x))
= - z * log(1 / (1 + exp(-x))) - (1 - z) * log(exp(-x) / (1 + exp(-x)))
= z * log(1 + exp(-x)) + (1 - z) * (-log(exp(-x)) + log(1 + exp(-x)))
= z * log(1 + exp(-x)) + (1 - z) * (x + log(1 + exp(-x))
= (1 - z) * x + log(1 + exp(-x))
= x - x * z + log(1 + exp(-x))

即后面代码中的prob_error2式

tf.keras.backend.binary_crossentropy与sigmoid_cross_entropy_with_logits输入有一些不一样，因为keras是已经内部封装好的函数，所以要求的输入是神经网络经过sigmoid后的输出，binary_crossentropy在内部会先将输入转化为logits，然后再调用tf.nn.sigmoid_cross_entropy_with_logits计算交叉熵。

下面做一个简单的验证，注意两个函数输入的不同