论文解读Focal Loss for Dense Object Detection

最新推荐文章于 2021-09-25 11:57:34 发布

全意

最新推荐文章于 2021-09-25 11:57:34 发布

阅读量883

点赞数

分类专栏：论文解读计算机视觉文章标签：物体检测物体识别深度学习计算机视觉 Focal-Loss

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/transMaple/article/details/78135684

版权

论文解读同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

计算机视觉

7 篇文章 0 订阅

订阅专栏

论文：Focal Loss for Dense Object Detection

引言：

目前最好的物体检测都是基于两个平台（two stage），和推荐驱动的机制（proposal-driven mechnism），如R-CNN。近期的集合为一个平台（one stage）的工作有YOLO和SSD，他们比前者更快
我们提出了一个新的损失函数用于类的区分（class imbalance），这个损失函数是一个动态缩放的交叉熵Loss（cross entropy loss），当正确分类的可信度提升时，缩放因子会衰退至0。

（我们提出的Focal Loss 就是正常的交叉熵Loss加上一个 $(1 - p_t )^\gamma$ 的因子，可以减少好的分类的样本的Loss, 设置 $\gamma$ ）
直观上，缩放椅子可以自动缩小简单样本的贡献的参数，从而可以更快的关注困难样本。实验显示我们提出的Focal Loss可以训练出更高的准确性的（one stage detector），其表现出了启发式取样和困难样本挖掘的效果。
我们提出了一个使用Focal Loss的网络：取名叫RetinaNet，效果很好

Focal Loss :

cross entropy是这样的：

C E (p, y) = {- log (p) - l o g (1 - p) if y = 1 otherwise.

$CE(p,y) = \begin{cases} -\log(p) & \text{if $y = 1$ } \\ -log(1 - p) & \text{otherwise.} \end{cases}$
其中

y∈{±1} $y\in\{\pm1\}$
为了标注的方便，我们设

pt $p_t$ :

p t = {p 1 - p if y = 1 otherwise

$p_t = \begin{cases} p &\text{if $y = 1$} \\ 1 - p &\text{otherwise} \end{cases}$
我们尝试引进一个权重因子

α∈[0,1] $\alpha\in[0 , 1]$ 控制class

1 $1$ ，

1−α $1-\alpha$ 控制class

−1 $-1$ ，像

pt $p_t$ 一样我们定义

αt $\alpha_t$ ，这样可以写出

α $\alpha$ 平衡后的交叉熵 CE loss：

C E (p t) = - α log (p t)

$CE(p_t)=-\alpha\log(p_t)$

容易区分的样本组成loss的主要部分并决定着梯度，然而 $\alpha$ 可以平衡正负样本的重要性，但不能区分容易和困难样本，所以我们重写了损失函数。
我们为cross entropy添加一个调节因子 $(1 - p_t )^\gamma$ ：

F L (p t) = - (1 - p t) γ log (p t)

$FL(p_t)=-(1-p_t)^\gamma\log(p_t)$
当一个样本被分类错误时，

pt $p_t$ 很小，所以

(1−pt)γ $(1 - p_t )^\gamma$ 很大，对loss的影响很小，当

pt $p_t$ 趋近1时，因子趋近0，所以对于分类好的loss权重下降。
在实验中我们也使用了

α $\alpha$

F L (p t) = - α t (1 - p t) γ log (p t)

$FL(p_t)=-\alpha_t(1-p_t)^\gamma\log(p_t)$
有

α $\alpha$ 的效果比没有的好，最后还发现计算

p $p$ 时使用sigmoid操作可以有更好的数的稳定性。

RetinaNet：

Feature Pyramid Network Backbone
金字塔的每一层用来检测不同的尺度

这里写图片描述
从图中可以看出左边是ResNet，中间为提取出feature map（加号为UpSampling后相加），然后用两个子网络相连，输出类别和边框。
实验结果

实验比较：

设 $\alpha=0.75$ 和不设置 $\alpha$ 相比，提高了 $0.9$ AP
设 $\gamma=2$ 和设 $\gamma=0$ 相比（相当于cross entropy），提高 $2.9$ AP
Focal Loss和OHEM相比，提高 $3.2$ AP

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
论文解读Focal Loss for Dense Object Detection

无
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。