《Focal Loss for Dense Object Detection》论文阅读笔记

最新推荐文章于 2021-09-25 11:57:34 发布

zhangbin0917

最新推荐文章于 2021-09-25 11:57:34 发布

阅读量827

点赞数

文章标签：深度学习目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15933615/article/details/79163347

版权

Focal Loss for Dense Object Detection

RetinaNet -- Best Student Paper Award at ICCV 2017

paper：ICCV 2017 arxiv

GitHub：https://github.com/facebookresearch/Detectron

state-of-the-art object detection存在两种方案：two-stage和one-stage

two-stage：R-CNN 、fast R-CNN 、faster R-CNN

two-stage方案第一阶段生成一组稀疏的候选对象位置(1-2k个)，第二阶段使用卷积神经网络将每个候选位置分类。在COCO benchmark 上实现了top accuracy，但速度较慢。

one-stage：YOLO、SSD

one-stage在一个阶段生成候选位置并分类，这些候选位置从位置、尺度、长宽比采样来生成密集的proposal(~100k个)，精度较差但速度快。

作者提出了这样一个问题：could a simple one-stage detector achieve similar accuracy?

由于发现阻碍one-stage detecter实现state-of-art accuracy的主要原因是训练时类别不平衡between foreground and background classes (e.g., 1:1000)。因此作者提出一种新的Loss fuction：focal loss来消除这种障碍。Focal Loss是动态缩放的cross entropy loss。实际上就是乘了一个缩放因子。如图所示。

对于很好分类的example，即概率比较大的，相对的减少其loss；而对于很难分类的，错分类的example，即概率比较小的，loss基本不变。

为了证明focal loss的有效性，作者设计了一个one-stage网络RetinaNet，最好的模型是基于ResNet-101-FPN在COCO test-dev上达到了39.1 AP，5 fps，超过了所有的one-stage和two-stage模型。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。