深度学习理论:Categorical crossentropy 损失函数

分类交叉熵是一种用于多类分类任务的损失函数。在这些任务中,一个示例只能属于许多可能类别中的一个,模型必须决定哪个类别。

 

形式上,它旨在量化两种概率分布之间的差异。

 73a4c03699824bcca213eac016fa2095.png

 

分类交叉熵的数学计算方式: 

交叉熵损失函数通过计算以下和来计算示例的损失:

 

fc7d807d2b6846888fe409588f1b8425.png

 

根据公式我们可以发现,因为yi,要么是0,要么是1。而当yi等于0时,结果就是0,当且仅当yi等于1时,才会有结果。也就是说categorical_crossentropy只专注与一个结果,因而它一般配合softmax做单标签分类。

分类交叉熵的使用方法:

分类交叉熵非常适合分类任务,因为一个示例可以被视为属于概率为1的特定类别和其他概率为0的类别。

 

示例:MNIST数字识别教程,其中有数字0、1、2、3、4、5、6、7、8和9的图像。

 

该模型使用绝对交叉熵来学习给正确的数字高概率,给其他数字低概率。

搭配的激活函数:

Softmax是唯一建议与类别交叉熵损失函数一起使用的激活函数。

严格来说,模型的输出只需要是正的,这样每个输出值的对数存在。

然而,这种损失函数的主要吸引力在于比较两种概率分布。Softmax激活重新缩放模型输出,使其具有正确的属性。

目标特征:

使用单个类别功能作为目标。

 

这将自动从数据集中确定的所有类别中创建一个单热向量。每个单热向量都可以被认为是一个概率分布,这就是为什么通过学习预测它,模型将输出一个示例属于任何类别的概率。

 

f08549aa9ab141dfbf05bfddbea4aedb.png

 

分类特征是在引擎盖下编码的。这使得它们直接适合与绝对的交叉熵损失函数一起使用。

 

或者,可以使用Numpy数组的数字功能来指定任何概率分布。

当希望模型预测任意概率分布,或者想实现标签平滑,这会很有用

 

 

  • 0
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
CNN(卷积神经网络)是一种常用的深度学习方法,主要用于图像识别、语音识别和自然语言处理等任务。在 CNN 中,常用的损失函数之一就是 sparse categorical crossentropy(稀疏分类交叉熵),下面将对其进行详细解释。 首先,交叉熵是一种常见的度量两个概率分布之间差异的方法。在分类问题中,我们通常将神经网络的输出表示为类别分布的概率,交叉熵就可以用来度量这个输出与样本真实类别分布之间的差距。而分类问题中的交叉熵可以分为 binary cross entropy 和 categorical cross entropy 两种,前者是二分类问题的交叉熵,后者则是多分类问题的交叉熵。 那么,稀疏分类交叉熵又是什么呢?在某些情况下,我们将标签用 one-hot 编码的形式表示,即每个样本都对应一个长度为分类数目的向量,其中只有一个位置为 1,表示该样本属于这个类别。但是,在实际的场景中,往往不是所有类别都会出现在训练集中,这就导致了大量的样本的标签向量中存在大量的零值,这种情况下,使用传统的 categorical cross entropy 可能会造成精度降低的问题。针对此类问题,tensorflow 提供了稀疏分类交叉熵的实现,其不需要将标签用 one-hot 编码形式表示,而是使用整数索引的形式,减小了数据的内存开销,并且能够更好地处理训练集类别不完备的情况,例如商品推荐、文本分类等任务。 总之,稀疏分类交叉熵是 CNN 中常用的损失函数之一,主要用于解决多分类问题中标签的稀疏性问题,它比传统的 categorical cross entropy 更适合处理训练集类别不完备的情况,能够提高模型精度,并且减小了内存开销。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UESTC_KS

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值