CVPR2018目标检测相关论文总结

                                      CVPR2018目标检测

 

1、Cascaded RCNN (相关度:

论文:Cascade R-CNN Delving into High Quality Object Detection 

论文链接:https://arxiv.org/abs/1712.00726 

代码链接:https://github.com/zhaoweicai/cascade-rcnn 

详细内容请移步:Cascade RCNN算法笔记

创新点及结论:分析proposal的IOU与最后检测的IOU间关系,得到结论: 当一个检测模型采用某个阈值(假设u=0.6)来界定正负样本时,那么当输入proposal的IOU在这个阈值(u=0.6)附近时,该检测模型比基于其他阈值训练的检测模型的效果要好。

 

2、Relation Networks for Object Detection (相关度:★)

论文:Relation Networks for Object Detection 

论文链接:https://arxiv.org/abs/1711.11575 

代码链接:https://github.com/msracver/Relation-Networks-for-Object-Detection 

详细内容请移步:Relation Networks for Object Detection算法笔记Relation Networks for Object Detection源码解读(网络结构细节)

创新点及结论: 模型学到object之间的关系, 在检测过程中可以通过利用图像中object之间的相互关系或者叫图像内容(context)来优化检测效果,这种关系既包括相对位置关系也包括图像特征关系

 

3、RefineDet (相关度:

论文:Single-Shot Refinement Neural Network for Object Detection 

论文链接:https://arxiv.org/abs/1711.06897 

代码链接:https://github.com/sfzhang15/RefineDet 

详细内容请移步:RefineDet算法笔记RefineDet算法源码 (一)训练脚本RefineDet算法源码(二)网络结构

创新点及结论:one-stage combine with two-stage , SSD算法和RPN网络、FPN算法的结合,可以在保持SSD高效的前提下提高检测效果。

 

4、SNIP (相关度:

论文:An Analysis of Scale Invariance in Object Detection – SNIP 

论文链接:https://arxiv.org/abs/1711.08189 

代码链接:http://bit.ly/2yXVg4c 

详细内容请移步:SNIP 算法笔记

问题:从数据集出发进行了非常详细的分析和实验对比,发现在COCO数据集中小目标占比要比ImageNet数据集大,这样在用ImageNt数据集的预训练模型时就会产生domain-shift问题,另外COCO数据集中的object尺寸变化范围非常大,即便采用multi-scale training的方式也很难训练一个检测器去cover所有scale的目标。

方法: 提出一种新的训练模型的方式:Scale Normalization for Image Pyramids (SNIP),该算法主要包含两个改进点:1、为了减少前面所提到的domain-shift,在梯度回传时只将和预训练模型所基于的训练数据尺寸相对应的ROI的梯度进行回传。2、借鉴了multi-scale training的思想,引入图像金字塔来处理数据集中不同尺寸的数据

 

5、R-FCN-3000 (相关度:

论文:R-FCN-3000 at 30fps: Decoupling Detection and Classification 

链接:https://arxiv.org/abs/1712.01802 

详细内容请移步:R-FCN-3000算法笔记

创新点:R-FCN算法(关于R-FCN算法的介绍可以看博客)应用在检测类别较多的场景下

6、DES (相关度:

论文:Single-Shot Object Detection with Enriched Semantics 

论文链接:https://arxiv.org/abs/1712.00433 

详细内容请移步:Detection with Enriched Semantics(DES)算法笔记

创新点及方法:

Detection with Enriched Semantics(DES)主要是基于SSD做改进,也是为了解决SSD中对于小目标物体的检测效果不好的问题,因为SSD算法对小目标的检测只是利用了浅层的特征,并没有用到高层的语义特征。因此这篇文章的出发点就是为了增加用于检测的feature map的语义信息,主要的措施包括:1、引入segmentation module用于得到attention mask,从而提高low level的feature map的语义信息。2、引入global activation module用于提高high level的feature map的语义信息

7、STDN (相关度:

论文:Scale-Transferrable Object Detection 

论文链接:https://pan.baidu.com/s/1i6Yjvpz 

详细内容请移步:Scale-Transferrable Detection Network(STDN)算法笔记

创新点: Scale-Transferrable Detection Network(STDN)算法主要用于提高object detection算法对不同scale的object的检测效果。

方法: 该算法采用DenseNet网络作为特征提取网络(自带高低层特征融合),基于多层特征做预测(类似SSD),并对预测结果做融合得到最终结果。该算法有两个特点:1、主网络采用DenseNet,了解DenseNet的同学应该知道该网络在一个block中,每一层的输入feature map是前面几层的输出feature map做concate后的结果,因此相当于高低层特征做了融合。高低层特征融合其实对object detection算法而言是比较重要的,FPN算法是显式地做了高低层特征融合,而SSD没有,这也是为什么SSD在小目标问题上检测效果不好的原因之一,因此该算法虽然看似SSD,但其实和SSD有区别。2、引入scale-transfer layer,实现了在几乎不增加参数量和计算量的前提下生成大尺寸的feature map(其他常见的算法基本上都是采用deconvolution或upsample),由于scale-transfer layer是一个转换操作,因此基本不会引入额外的参数量和计算量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值