CVPR2018目标检测相关论文总结

最新推荐文章于 2024-09-06 18:42:53 发布

南石北岸生

最新推荐文章于 2024-09-06 18:42:53 发布

阅读量2.1k

点赞数 3

分类专栏：目标检测

本文链接：https://blog.csdn.net/gusui7202/article/details/84337298

版权

目标检测专栏收录该内容

29 篇文章 1 订阅

订阅专栏

CVPR2018目标检测

1、Cascaded RCNN （相关度：★）

论文：Cascade R-CNN Delving into High Quality Object Detection

论文链接：https://arxiv.org/abs/1712.00726

代码链接：https://github.com/zhaoweicai/cascade-rcnn

详细内容请移步：Cascade RCNN算法笔记

创新点及结论：分析proposal的IOU与最后检测的IOU间关系，得到结论：当一个检测模型采用某个阈值（假设u=0.6）来界定正负样本时，那么当输入proposal的IOU在这个阈值（u=0.6）附近时，该检测模型比基于其他阈值训练的检测模型的效果要好。

2、Relation Networks for Object Detection （相关度：★★★★）

论文：Relation Networks for Object Detection

论文链接：https://arxiv.org/abs/1711.11575

代码链接：https://github.com/msracver/Relation-Networks-for-Object-Detection

详细内容请移步：Relation Networks for Object Detection算法笔记、Relation Networks for Object Detection源码解读（网络结构细节）

创新点及结论：让模型学到object之间的关系，在检测过程中可以通过利用图像中object之间的相互关系或者叫图像内容（context）来优化检测效果，这种关系既包括相对位置关系也包括图像特征关系。

3、RefineDet （相关度：★★）

论文：Single-Shot Refinement Neural Network for Object Detection

论文链接：https://arxiv.org/abs/1711.06897

代码链接：https://github.com/sfzhang15/RefineDet

详细内容请移步：RefineDet算法笔记、RefineDet算法源码（一）训练脚本、RefineDet算法源码（二）网络结构

创新点及结论：one-stage combine with two-stage , SSD算法和RPN网络、FPN算法的结合，可以在保持SSD高效的前提下提高检测效果。

4、SNIP （相关度：★★★）

论文：An Analysis of Scale Invariance in Object Detection – SNIP

论文链接：https://arxiv.org/abs/1711.08189

代码链接：http://bit.ly/2yXVg4c

详细内容请移步：SNIP 算法笔记

问题：从数据集出发进行了非常详细的分析和实验对比，发现在COCO数据集中小目标占比要比ImageNet数据集大，这样在用ImageNt数据集的预训练模型时就会产生domain-shift问题，另外COCO数据集中的object尺寸变化范围非常大，即便采用multi-scale training的方式也很难训练一个检测器去cover所有scale的目标。

方法：提出一种新的训练模型的方式：Scale Normalization for Image Pyramids (SNIP)，该算法主要包含两个改进点：1、为了减少前面所提到的domain-shift，在梯度回传时只将和预训练模型所基于的训练数据尺寸相对应的ROI的梯度进行回传。2、借鉴了multi-scale training的思想，引入图像金字塔来处理数据集中不同尺寸的数据。

5、R-FCN-3000 （相关度：★）

论文：R-FCN-3000 at 30fps: Decoupling Detection and Classification

链接：https://arxiv.org/abs/1712.01802

详细内容请移步：R-FCN-3000算法笔记

创新点：R-FCN算法（关于R-FCN算法的介绍可以看博客）应用在检测类别较多的场景下

6、DES （相关度：★★）

论文：Single-Shot Object Detection with Enriched Semantics

论文链接：https://arxiv.org/abs/1712.00433

详细内容请移步：Detection with Enriched Semantics(DES)算法笔记

创新点及方法：

Detection with Enriched Semantics(DES)主要是基于SSD做改进，也是为了解决SSD中对于小目标物体的检测效果不好的问题，因为SSD算法对小目标的检测只是利用了浅层的特征，并没有用到高层的语义特征。因此这篇文章的出发点就是为了增加用于检测的feature map的语义信息，主要的措施包括：1、引入segmentation module用于得到attention mask，从而提高low level的feature map的语义信息。2、引入global activation module用于提高high level的feature map的语义信息。

7、STDN （相关度：★★）

论文：Scale-Transferrable Object Detection

论文链接：https://pan.baidu.com/s/1i6Yjvpz

详细内容请移步：Scale-Transferrable Detection Network（STDN）算法笔记

创新点： Scale-Transferrable Detection Network（STDN）算法主要用于提高object detection算法对不同scale的object的检测效果。

方法：该算法采用DenseNet网络作为特征提取网络（自带高低层特征融合），基于多层特征做预测（类似SSD），并对预测结果做融合得到最终结果。该算法有两个特点：1、主网络采用DenseNet，了解DenseNet的同学应该知道该网络在一个block中，每一层的输入feature map是前面几层的输出feature map做concate后的结果，因此相当于高低层特征做了融合。高低层特征融合其实对object detection算法而言是比较重要的，FPN算法是显式地做了高低层特征融合，而SSD没有，这也是为什么SSD在小目标问题上检测效果不好的原因之一，因此该算法虽然看似SSD，但其实和SSD有区别。2、引入scale-transfer layer，实现了在几乎不增加参数量和计算量的前提下生成大尺寸的feature map（其他常见的算法基本上都是采用deconvolution或upsample），由于scale-transfer layer是一个转换操作，因此基本不会引入额外的参数量和计算量。