深度学习分类：交叉熵

逐梦苍穹

于 2024-08-26 07:00:00 发布

阅读量746

点赞数 21

文章标签：深度学习分类人工智能交叉熵

本文链接：https://blog.csdn.net/qq_60735796/article/details/141538108

版权

补充一个深度学习分类重要的概念：交叉熵
交叉熵 (Cross Entropy) 是一种衡量两个概率分布之间差异的损失函数，常用于机器学习和深度学习中的分类问题。其基本思想是衡量真实分布与预测分布之间的不一致性。

交叉熵的数学定义

如果我们有一个目标分布 $p (x)$ 和一个预测分布 $q (x)$ ，它们在同一个事件空间上定义，那么交叉熵 $H (p, q)$ 可以定义为：
$-\sum_x p(x) \log q(x)$
在机器学习中，尤其是分类任务中，目标分布 $p (x)$ 通常是一个真实的分布，即用 $i$ 代表的 one-hot 编码的分类标签，而预测分布 $q (x)$ 是模型输出的概率分布。交叉熵可以被用来衡量模型预测的概率分布和真实分布之间的距离。

二分类问题中的交叉熵

对于二分类问题，目标可以是 $\in \{0, 1\}$ ，模型输出的是预测的概率 $\hat{y}$ 。交叉熵损失函数可以表示为：
$\text{Cross-Entropy Loss} = -[y \log(\hat{y}) + (1-y) \log(1-\hat{y})]$

多分类问题中的交叉熵

在多分类问题中，假设有 $C$ 个类，真实标签 $y$ 是 one-hot 编码形式，即对于正确类别 $y_i=1$ ，其他类别 $y_i=0$ 。交叉熵损失函数是一个包含 $C$ 项的和。此时交叉熵损失函数为：
$\text{Cross-Entropy Loss} = -\sum_{i=1}^C y_i \log(\hat{y_i})$
其中，只有与正确类别对应的那一项会有贡献，因为其他类别的 $y_i=0$ 。