focalloss，diceloss 知识点总结

最新推荐文章于 2025-02-19 16:02:11 发布

啥也不会就会混

最新推荐文章于 2025-02-19 16:02:11 发布

阅读量8.4k

点赞数 7

分类专栏：图像分割文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/qq_40950565/article/details/120104901

版权

图像分割专栏收录该内容

3 篇文章

订阅专栏

一 focalloss

1.什么是focalloss，用来干嘛

Focal loss最早是 He et al 在论文 Focal Loss for Dense Object Detection 中实现的。

例如在目标检测中损失函数Binary Cross Entropy loss，这种训练目标要求模型对自己的预测真的很有信心。而Focal Loss所做的是，它使模型可以更"放松"地预测事物，而无需80-100％确信此对象是“某物”。简而言之，它给模型提供了更多的自由，可以在进行预测时承担一些风险。这在处理高度不平衡的数据集时尤其重要，因为在某些情况下（例如癌症检测），即使预测结果为假阳性也可接受，确实需要模型承担风险并尽量进行预测。

因此，Focal loss在样本不平衡的情况下特别有用。特别是在“对象检测”的情况下，大多数像素通常都是背景，图像中只有很少数的像素具有我们感兴趣的对象。

该损失函数是一个动态缩放的交叉熵损失，当正确类别的置信度增加时，比例因子衰减为零，见图。直观地说，这个比例因子可以在训练过程中自动降低简单示例的权重，并快速将模型集中到难样本上。从图像中可以看出，当模型预测为真实标签的概率为0.6左右时，交叉熵损失仍在0.5左右。因此，为了在训练过程中减少损失，我们的模型将必须以更高的概率来预测到真实标签。换句话说，交叉熵损失要求模型对自己的预测非常有信心。但这也同样会给模型表现带来负面影响。深度学习模型会变得过度自信，泛化能力下降。

从比较Focal loss与CrossEntropy的图表可以看出，当使用γ> 1的Focal Loss可以减少“分类得好的样本”或者说“模型预测正确概率大”的样本的训练损失，而对于“难以分类的示例”，比如预测概率小于0.5的，则不会减小太多损失。因此，在数据类别不平衡的情况下，会让模型的注意力放在稀少的类别上，因为这些类别的样本见过的少，比较难分。

2. 原理

以下引自原论文：

焦点损失旨在解决单级目标检测场景在训练期间前景类和背景类之间存在极端不平衡（例如，1:1000）的问题。我们引入了从二元分类的交叉熵（CE）损失开始的焦点损失
在这里插入图片描述

其中y∈{±1}指定了基本真值类，p∈[0,1]是该类的模型估计概率。为了便于标注，我们将pt定义为：在这里插入图片描述
并重新写成CE(p, y) = CE(pt) = −log(pt).
CE损耗可以看作图1中的蓝色（顶部）曲线。这一损失的一个显著特征是，即使是那些容易分类的例子（pt>0.5），也可以很容易地从图中看出并损失较大。在大量简单的例子中进行总结时，这些小的损失值就会覆盖稀有类。