Focal Loss损失函数详解

最新推荐文章于 2024-06-10 23:38:42 发布

追逐AI的蜗牛

最新推荐文章于 2024-06-10 23:38:42 发布

阅读量6.4k

点赞数 6

本文链接：https://blog.csdn.net/qq_38675397/article/details/106496333

版权

Focal Loss损失函数是何凯明大神在RetinaNet网络中提出的，解决了one-stage目标检测中正负样本极不平衡和难分类样本学习的问题，下面我们来详细理解一下该函数。

背景

什么是正负样本极不平衡？

目标检测算法为了定位目标会生成大量的anchor box，而一幅图中目标(正样本)个数很少，大量的anchor box处于背景区域(负样本)，这就导致了正负样本极不平衡

two-stage为什么可以避免样本极不平衡？

two-stage方法在第一阶段生成候选框，RPN只是对anchor box进行简单背景和前景的区分，并不对类别进行区分，经过这一轮处理，过滤掉了大部分属于背景的anchor box，较大程度降低了anchor box正负样本的不平衡性(注意：只是减轻了样本不平衡并没有解决样本不平衡)；同时在第二阶段采用启发式采样(如：正负样本比1：3)或者OHEM进一步减轻正负样本不平衡的问题。

one-stage为什么不能避免样本极不平衡？

one-stage方法为了提高检测速度，舍弃了生成候选框这一阶段，直接对anchor box进行难度更大的细分类(不只是区分前景背景，还区分anchor box属于什么类别)，缺少了对anchor box的筛选过程。

Focal Loss

交叉熵

二分类交叉熵损失函数

现定义如下的 $p_{t}$

得到变形后的损失函数如下：

平衡交叉熵

一般为了解决类别不平衡的问题，会在损失函数中每个类别前增加一个权重因子 $\alpha _{i}$ $α^{i}$ ∈ [0, 1]来协调类别不平衡。使用 $p_{t}$ 类似的方式定义 $\alpha _{t}$ ，得到二分类平衡交叉熵损失函数：

Focal Loss

类别极度不平衡在训练中，易分类负样本占了损失函数大部分，支配了梯度，会压垮交叉熵损失函数。平衡交叉熵采用 $\alpha$ 平衡正负样本的重要性，但是没有区分难易样本。Focal Loss在平衡交叉熵损失函数的基础上，增加一个调节因子降低易分类样本权重，聚焦于困难样本的训练，其定义如下：

其中， $(1-p_{t})^{\gamma }$ 是调节因子， $\gamma$ ≥ 0是可调节的聚焦参数，下图展示了 $\gamma$ ∈ [0, 5]不同值时focal loss曲线

下面分析一下Focal Loss的特点：

当 $p_{t}$ 很小时(样本难分，不管分的是否正确)，调节因子趋近1，损失函数中样本的权重不受影响；当 $p_{t}$ 很大时(样本易分，不管分的是否正确)，调节因子趋近0，损失函数中样本的权重下降很多
聚焦参数 $\gamma$ 可以调节易分类样本权重的降低程度， $\gamma$ 越大权重降低程度越大

通过分析Focal Loss函数的特点可知，该损失函数降低了易分类样本的权重，聚焦在难分类样本上。

追逐AI的蜗牛

关注

6
点赞
踩
36

收藏

觉得还不错? 一键收藏
0
评论
Focal Loss损失函数详解

Focal Loss损失函数是何凯明大神在RetinaNet网络中提出的，主要目的是为了解决one-stage目标检测中正负样本极不平衡的问题，下面我们来详细理解一下该函数。背景什么是正负样本极不平衡？目标检测算法为了定位目标会生成大量的anchor box，而一幅图中目标(正样本)个数很少，大量的anchor box处于背景区域(负样本)，这就导致了正负样本极不平衡two-stage为什么可以避免样本极不平衡？ two-stage方法在第一阶段生成候...
复制链接

扫一扫