2017cvpr 目标检测

66人阅读 评论(0) 收藏 举报
分类:
作者:xiaozhi
链接:https://zhuanlan.zhihu.com/p/28088956
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

(1)Speed/accuracy trade-offs for modern convolutional object detectors

其主要考虑三种检测器(Faster RCNN,R-FCN,SSD)作为元结构,三种CNN网络(VGG,Inception,ResNet)作为特征提取器,变化其他参数如图像分辨率、proposals数量等,研究目标检测系统准确率与速度的权衡关系。

(2)YOLO9000:Better, Faster, Stronger

其为YOLO升级版,其对YOLO方法作了一些改进,Better方面考虑(Batch Normalization, High Resolution, Anchor Boxes, Dimension Clusters, Direct location prediction, Fine-Grained Features, Multi-Scale Training),Faster方面提出一个新的Darknet-19结构。除此之外,其提出一个方法在目标检测数据集与图像分类数据集上联合训练,主要构建了一个视觉内容分层树结构WordTree。

(3)A-Fast-RCNN: Hard positive generation via adversary for object detection

其主要考虑学习一个对于遮挡和形变具有不变性的目标检测器,收集各种状态目标的大数据集的数据驱动策略存在一定问题,比如遮挡和形变服从长尾理论,因此提出学习一个对抗网络(ASTN,ASDN)生成具有遮挡和形变的困难样本,通过生成器与检测器的博弈,提升目标检测器对于各种状态物体的整体目标检测性能。

(4)Feature Pyramid Networks for Object Detection

其主要考虑利用深度卷积网络固有的多尺度金字塔形层次结构来构建特征金字塔,创建了一个具有横向连接的自顶向下架构用于在所有尺度上构建高级语义特征图,FPN作为通用特征提取器表现优异,论文研究表明,尽管深度ConvNets具有强大的表达能力和对尺度变化内在的鲁棒性,使用金字塔表示来明确地解决多尺度问题仍然是重要的。

(5)RON: Reverse Connection with Objectness Prior Networks for Object Detection

其主要考虑两个问题,多尺度目标定位和负样本挖掘,并分别提出Reverse Connection使得网络能在CNN多尺度检测目标和Objectness Prior减少目标的搜索空间,最后通过多任务损失联合优化Reverse Connection、Objectness Prior和目标检测器。

(6)Accurate Single Stage Detector Using Recurrent Rolling Convolution

其提出一个新型端到端训练目标检测网络,在多尺度特征图引入Recurrent Rolling Convolution结构创建“deep in context”的分类器和回归器,其主要也是考虑“top-down/bottom-up”的特征集成。

(7)Mimicking Very Efficient Network for Object Detection

当前目标检测器都需要从预训练ImageNet分类模型初始化,其相比从零开始训练能达到更好的效果,而预训练图像分类模型对于检测任务并非最优的,其主要考虑训练高效检测器而不需要ImageNet的预训练。其研究已有的一个满足检测表现的网络如何指导其他网络的训练,即利用一个检测网络监督另一个更高效的网络并保持准确率,其提出特征mimic技术。

(8)Perceptual Generative Adversarial Networks for Small Object Detection

小目标因其低分辨率和噪声表示检测困难,现有方法主要考虑在多尺度学习所有目标的特征表示,其受限于计算复杂度。其主要考虑建立单个架构来解决小目标检测问题,该架构将小目标的表示提升到“super-resolved”,从而实现与大目标类似的特征,从而对于检测任务更加具有辨别能力。利用生成式对抗网络,其提出Perceptual GAN模型,通过缩小小目标与大目标的表示差异来改善小目标检测。


cvpr2017 目标检测

(1)Speed/accuracy trade-offs for modern convolutional object detectors

其主要考虑三种检测器(Faster RCNN,R-FCN,SSD)作为元结构,三种CNN网络(VGG,Inception,ResNet)作为特征提取器,变化其他参数如图像分辨率、proposals数量等,研究目标检测系统准确率与速度的权衡关系。

(2)YOLO9000:Better, Faster, Stronger

其为YOLO升级版,其对YOLO方法作了一些改进,Better方面考虑(Batch Normalization, High Resolution, Anchor Boxes, Dimension Clusters, Direct location prediction, Fine-Grained Features, Multi-Scale Training),Faster方面提出一个新的Darknet-19结构。除此之外,其提出一个方法在目标检测数据集与图像分类数据集上联合训练,主要构建了一个视觉内容分层树结构WordTree。

(3)A-Fast-RCNN: Hard positive generation via adversary for object detection

其主要考虑学习一个对于遮挡和形变具有不变性的目标检测器,收集各种状态目标的大数据集的数据驱动策略存在一定问题,比如遮挡和形变服从长尾理论,因此提出学习一个对抗网络(ASTN,ASDN)生成具有遮挡和形变的困难样本,通过生成器与检测器的博弈,提升目标检测器对于各种状态物体的整体目标检测性能。

(4)Feature Pyramid Networks for Object Detection

其主要考虑利用深度卷积网络固有的多尺度金字塔形层次结构来构建特征金字塔,创建了一个具有横向连接的自顶向下架构用于在所有尺度上构建高级语义特征图,FPN作为通用特征提取器表现优异,论文研究表明,尽管深度ConvNets具有强大的表达能力和对尺度变化内在的鲁棒性,使用金字塔表示来明确地解决多尺度问题仍然是重要的。

(5)RON: Reverse Connection with Objectness Prior Networks for Object Detection

其主要考虑两个问题,多尺度目标定位和负样本挖掘,并分别提出Reverse Connection使得网络能在CNN多尺度检测目标和Objectness Prior减少目标的搜索空间,最后通过多任务损失联合优化Reverse Connection、Objectness Prior和目标检测器。

(6)Accurate Single Stage Detector Using Recurrent Rolling Convolution

其提出一个新型端到端训练目标检测网络,在多尺度特征图引入Recurrent Rolling Convolution结构创建“deep in context”的分类器和回归器,其主要也是考虑“top-down/bottom-up”的特征集成。

(7)Mimicking Very Efficient Network for Object Detection

当前目标检测器都需要从预训练ImageNet分类模型初始化,其相比从零开始训练能达到更好的效果,而预训练图像分类模型对于检测任务并非最优的,其主要考虑训练高效检测器而不需要ImageNet的预训练。其研究已有的一个满足检测表现的网络如何指导其他网络的训练,即利用一个检测网络监督另一个更高效的网络并保持准确率,其提出特征mimic技术。

(8)Perceptual Generative Adversarial Networks for Small Object Detection

小目标因其低分辨率和噪声表示检测困难,现有方法主要考虑在多尺度学习所有目标的特征表示,其受限于计算复杂度。其主要考虑建立单个架构来解决小目标检测问题,该架构将小目标的表示提升到“super-resolved”,从而实现与大目标类似的特征,从而对于检测任务更加具有辨别能力。利用生成式对抗网络,其提出Perceptual GAN模型,通过缩小小目标与大目标的表示差异来改善小目标检测。

查看评论

CVPR2017有哪些值得读的Image Caption论文?

作者丨崔权 学校丨早稻田大学硕士生 研究方向丨深度学习,计算机视觉 知乎专栏丨サイ桑的炼丹炉 前言 由于最近在做一个 Image Caption 的任务,...
  • c9Yv2cf9I06K2A9E
  • c9Yv2cf9I06K2A9E
  • 2017-11-29 00:00:00
  • 914

CVPR2017-目标检测相关

(1)Speed/accuracy trade-offs for modern convolutional object detectors 其主要考虑三种检测器(Faster RCNN,R-F...
  • Touch_Dream
  • Touch_Dream
  • 2017-08-22 22:22:20
  • 3874

开源|2017 CVPR(Oral Paper):多目标实时体态估测 项目开源

转自:http://mt.sohu.com/20170321/n484047638.shtml 本目录下的代码赢得了2016年MSCOCO关键点挑战赛以及2016年ECCV最佳演示奖,并发表在20...
  • huixingshao
  • huixingshao
  • 2017-03-22 09:23:15
  • 1344

从CVPR2017 看多样目标检测

北京 上海巡回站 | NVIDIA DLI深度学习培训2018年1月26/1月12日NVIDIA 深度学习学院 带你快速进入火热的DL领域阅读全文                          正...
  • leadai
  • leadai
  • 2018-01-16 00:00:00
  • 1908

CVPR 2017 全部及部分论文解读集锦

原文链接:http://mp.weixin.qq.com/sbiz=MzI5MDUyMDIxNA==&mid=2247484464&idx=1&sn=b852980edd194eefb2515a1cc...
  • u011650143
  • u011650143
  • 2017-07-18 09:52:05
  • 10177

2017CVPR Person Re-id

  • 2017年09月27日 14:21
  • 9.47MB
  • 下载

目标检测--RON: Reverse Connection with Objectness Prior Networks for Object Detection

RON: Reverse Connection with Objectness Prior Networks for Object Detection CVPR2017 https://githu...
  • zhangjunhit
  • zhangjunhit
  • 2017-08-30 15:55:11
  • 1910

目标跟踪相关资源(含模型,CVPR2017论文,代码,牛人等)

Visual Trackers ECO: Martin Danelljan, Goutam Bhat, Fahad Shahbaz Khan, Michael Felsberg. "ECO: E...
  • u012762641
  • u012762641
  • 2017-07-05 20:30:20
  • 4200

2017-ICCV-Mask R-CNN

本周组会讲Mask R-CNN,借此机会把目标检测R-CNN系列的论文都整理了一遍,除了paper外,主要参考网上的一些博客,如有侵权,请告知,在此十分感谢。 文中如有错误,请积极指出,一起学习,共...
  • RhineYu
  • RhineYu
  • 2018-03-21 18:44:34
  • 115

CVPR2016有关跟踪的论文

  • 2017年01月12日 15:05
  • 20.62MB
  • 下载
    个人资料
    持之以恒
    等级:
    访问量: 28万+
    积分: 5550
    排名: 5983
    最新评论