综述一:二十年的目标检测大综述(经典,必须收藏)

关注并星标

从此不迷路

计算机视觉研究院

4ec9f187691c98598f87d3d2475a3a0e.png

fecdc318318cc63466427280addf74b7.png

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

不知不觉2021年“计算机视觉研究院”又陪伴大家快一年了,我们一直在陪伴,分享最好最有质量的知识,陪伴大家度过每一天。今天开始,我们准备分享一次综述性知识,有兴趣的同学加入我们一起来学习,共同进步!

目 录

1 INTRODUCTION

2 OBJECT DETECTION IN 20 YEARS

2.1 A Road Map of Object Detection

2.1.1 Milestones: Traditional Detectors

2.1.2 Milestones: CNN based Two-stage Detectors

2.1.3 Milestones: CNN based One-stage Detectors

2.2 Object Detection Datasets and Metrics

2.2.1 Metrics

2.3 Technical Evolution in Object Detection

2.3.1 Early Time’s Dark Knowledge

2.3.2 Technical Evolution of Multi-Scale Detection

2.3.3 Technical Evolution of Bounding Box Regression

2.3.4 Technical Evolution of Context Priming

2.3.5 Technical Evolution of Non-Maximum Suppression

2.3.6 Technical Evolution of Hard Negative Mining

3 SPEED-UP OF DETECTION

3.1 Feature Map Shared Computation

3.1.1 Spatial Computational Redundancy and Speed Up

3.1.2 Scale Computational Redundancy and Speed Up

3.2 Speed up of Classifiers

3.3 Cascaded Detection

3.4 Network Pruning and Quantification

3.4.1 Network Pruning

3.4.2 Network Quantification

3.4.3 Network Distillation

3.5 Lightweight Network Design

3.5.1 Factorizing Convolutions

3.5.2 Group Convolution

3.5.3 Depth-wise Separable Convolution

3.5.4 Bottle-neck Design

3.5.5 Neural Architecture Search

3.6 Numerical Acceleration

3.6.1 Speed Up with Integral Image

3.6.2 Speed Up in Frequency Domain

3.6.3 Vector Quantization

3.6.4 Reduced Rank Approximation

4 RECENT ADVANCES IN OBJECT DETECTION

4.1 Detection with Better Engines&Object detectors with new engines

4.2 Detection with Better Features

4.2.1 Why Feature Fusion is Important?

4.2.2 Feature Fusion in Different Ways

4.2.3 Learning High Resolution Features with Large Receptive Fields

4.3 Beyond Sliding Window

4.4 Improvements of Localization

4.4.1 Bounding Box Refinement

4.4.2 Improving Loss Functions for Accurate Localization

4.5 Learning with Segmentation

4.5.1 Why Segmentation Improves Detection?

4.5.2 How Segmentation Improves Detection?

4.6 Robust Detection of Rotation and Scale Changes

4.6.1 Rotation Robust Detection

4.6.2 Scale Robust Detection

4.7 Training from Scratch

4.8 Adversarial Training

4.9 Weakly Supervised Object Detection

5 APPLICATIONS

5.1 Pedestrian Detection

5.1.1 Difficulties and Challenges

5.1.2 Literature Review

5.2 Face Detection

5.2.1 Difficulties and Challenges

5.2.2 Literature review

5.3 Text Detection

5.3.1 Difficulties and Challenges

5.3.2 Literature Review

5.4 Traffic Sign and Traffic Light Detection

5.4.1 Difficulties and Challenges

5.4.2 Literature Review

5.5 Remote Sensing Target Detection

5.5.1 Difficulties and Challenges

5.5.2 Literature Review

6 CONCLUSION AND FUTURE DIRECTIONS

681c5d4dbcf77f31f6c9eec4d52b70aa.png

今天我们就先说说第一章:INTRODUCTION

目标检测是数字图像中某一类 ( 如人、动物或汽车 ) 的重要计算机视觉任务。目标检测的目标是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:什么目标在哪里?

目标检测作为计算机视觉的基本问题之一,是许多其他计算机视觉任务的基础,如实例分割、图像字幕、目标跟踪等。从应用程序的角度来看,目标检测可以被分为两个研究主题:“ General Object Detection ” 和 “ Detection Applications ” ,前者旨在探索在统一的框架下检测不同类型物体的方法,以模拟人类的视觉和认知;后者是指特定应用场景下的检测,如行人检测、人脸检测、文本检测等。

近年来,随着深度学习技术的快速发展,为目标检测注入了新的血液,取得了显著的突破,将其推向了一个前所未有的研究热点。目前,目标检测已广泛应用于自主驾驶、机器人视觉、视频监控等领域。下图就显示了过去二十年中与 “ 目标检测 ” 相关的出版物数量的增长。

14e14e72d32ad80c0644d4a6bc084d64.png

区别

近年来发表了许多关于 General Object Detection 的综述。本文与上述综述的主要区别总结如下:

  1. 基于技术演进的全面回顾:本文广泛回顾了对象检测发展史上的400多篇论文,时间跨度超过25年 ( 上世纪90年代至2019年 )。以前的大多数综述仅仅关注一个较短的历史时期或一些特定的检测任务,而没有考虑它们整个生命周期中的技术演进。站在历史的高速公路上,不仅有助于读者建立一个完整的知识体系,而且有助于找到这个快速发展领域的未来方向。

  2. 深入探索关键技术和最新技术状态:经过多年的发展,目前的先进的对象检测系统已经与 “ 多尺度检测 ”、“ 困难负样本挖掘 ” 、“ 边界框回归 ” 等大量技术相结合,然而,以前的综述缺乏基本的分析来帮助读者理解这些复杂技术的本质,例如,“ 它们从哪里来,它们是如何进化的? ”、“ 每种方法的优缺点是什么? ”本文针对上述问题对读者进行了深入的分析。

  3. 全面分析加速检测技术:加速目标检测一直是一项关键而又具有挑战性的任务。本文从多个层面对近20年来目标检测技术的发展进行了全面的回顾,包括 “ 检测管道 ” ( 如级联检测、特征图共享计算 )、“ 检测主干 ”( 如网络压缩、轻量级网络设计 )、“ 数值计算 ”( 如积分图像、矢量量化 )。以前的综述很少涉及这个主题。

难点和挑战

尽管人们总是问 “ 在目标检测中有哪些困难和挑战? ” ,事实上,这个问题并不容易回答,甚至可能被过度概括。由于不同的检测任务具有完全不同的目标和约束,它们的困难程度可能会有所不同。除了其他计算机视觉任务中的一些常见挑战,如不同视点下的物体、光照和类内变化,目标检测的挑战包括但不限于以下几个方面:目标旋转和尺度变化 ( 如小目标 ) ,精确的目标定位,密集和遮挡的目标检测,加速检测等。

在之后的第四章和第五章中,我们将对这些主题进行更详细的分析。

© THE END 

感谢Zhengxia Zou等人的无私贡献,本系列综述引用于《Object Detection in 20 Years: A Survey》,有兴趣的同学可以下载慢慢品!

转载请联系本公众号获得授权

f62638cb510c94248d3f65f1a38b6c27.gif

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

460cdaf7decf1e41ecd94d7db18dd3a4.png

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

 往期推荐 

🔗

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值