二元交叉熵损失函数（Binary Cross Entropy Loss，BCELoss）是交叉熵损失函数（CrossEntropyLoss）的特殊情况

重剑DS

已于 2024-01-31 15:10:23 修改

阅读量2.2k

点赞数 1

分类专栏：深度学习文章标签：机器学习人工智能深度学习 BCELoss 交叉熵

于 2023-11-11 15:41:27 首次发布

本文链接：https://blog.csdn.net/qq_45732909/article/details/134348685

版权

深度学习专栏收录该内容

37 篇文章 0 订阅

订阅专栏

一直以来看到二元交叉熵损失函数（Binary Cross Entropy Loss，BCELoss）
还以为是很复杂的东西，原来其实是交叉熵损失函数（CrossEntropyLoss）的特殊情况，也就是二元交叉熵损失函数其实就是交叉熵损失函数。

推导如下：

对于多分类问题，交叉熵损失函数的一般形式如下：

$\text{CrossEntropyLoss}(\text{\textbf{input}}, \text{target}) = -\sum_{i=1}^{C} \text{target}_i \cdot \log(\text{softmax}(\text{\textbf{input}})_i)$

其中：

input 是模型的输出，是一个包含了未归一化的分数（logits）的向量。
target 是真实的标签，是一个表示类别的 one-hot 编码向量。
C 是类别的数量。
softmax(⋅) 是 softmax 函数，将输入的分数转换成概率分布。softmax(input)_i表示取softmax运算后结果向量的第i个分量（标量，值）

对于二元分类问题，我们可以将多分类问题中的公式特殊化。假设只有两个类别（C = 2），我们可以将多分类交叉熵损失函数中的求和项简化为只有两项，如下：

$\text{CrossEntropyLoss}(\text{\textbf{input}}, \text{target}) = -(\text{target}_1 \cdot \log(\text{softmax}(\text{\textbf{input}})_1) + \text{target}_2 \cdot \log(\text{softmax}(\text{\textbf{input}})_2))$

在二元分类中，因为只有两个类别target₁和target₂，且概率和为1，因此，我们可以将上述公式中的 softmax(input)₂替换为 1 - softmax(input)₁，softmax(input)₂替换为1 - softmax(input)₁。得到如下形式：

$\text{BCELoss}(\text{\textbf{input}}, \text{target}) = -(\text{target}_1 \cdot \log(\text{softmax}(\text{\textbf{input}})_1) + (1 - \text{target}_1) \cdot \log(1 - \text{softmax}(\text{\textbf{input}})_1))$

在二元分类中，比如在推荐系统里，算出来的结果往往是 user 对 item 的评分预测，是个值，不是上面 input
向量，所以直接对这个评分预测套个Sigmoid，将最终的评分预测的范围整到表示概率的 (0, 1) 的范围里去，我感觉这样操作起来更方便。所以，我们可以将上式中的 softmax(input) ₁换成Sigmoid(y^{^}_uv) ，得到如下二元交叉熵损失函数的形式：

$\text{BCELoss}(\text{\textbf{input}}, \text{target}) = -(\text{target} \cdot \log(\text{sigmoid}(\hat{y}_{uv}) + (1 - \text{target}) \cdot \log(1 - \text{sigmoid}(\hat{y}_{uv})))$

这个形式的损失函数是从多分类问题中的交叉熵损失函数推导得到的，并在二元分类问题中特殊化。

上图的BCE loss形式是没有考虑负样本的情况的。

在这里插入图片描述
上图的BCE loss形式是考虑负样本的情况的。

就拿在推荐系统领域来说，任务中往往存在大量的负样本（未发生交互的用户-物品对），而正样本（用户与被点击的物品对）相对较少。为了高效地训练模型，通常会采用负采样的方法。

重剑DS

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
二元交叉熵损失函数（Binary Cross Entropy Loss，BCELoss）是交叉熵损失函数（CrossEntropyLoss）的特殊情况

一直以来看到还以为是很复杂的东西，原来其实是，也就是二元交叉熵损失函数其实就是交叉熵损失函数。
复制链接

扫一扫