目标检测：传统目标检测方法

SunshineSki

已于 2022-10-05 11:21:27 修改

阅读量3.9w

点赞数 45

分类专栏：目标检测文章标签：传统目标检测

于 2018-11-17 06:12:36 首次发布

本文链接：https://blog.csdn.net/SunshineSki/article/details/84157881

版权

目标检测专栏收录该内容

4 篇文章

订阅专栏

本文介绍了目标检测在计算机视觉中的重要性及其实现过程。详细阐述了传统目标检测的三大步骤：区域选择、特征提取和分类器应用，并讨论了其局限性，包括滑窗策略的时间复杂度高和手工特征的鲁棒性差等问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引言

提到Computer Vision，可能我们会最先想到CV的基本任务Image Classification，但在此基础上，还有其他更为复杂和有趣的任务，如Object Detection、Object Localization、Image Segmentation等等，而其中目标检测（Object Detection）是一件比较实际的且具有挑战性的计算机视觉任务，其可以看成图像分类与定位的结合，给定一张图片，目标检测系统要能够识别出图片的目标并给出其位置，由于图片中目标数是不定的，且要给出目标的精确位置，目标检测相比分类任务更复杂。目标检测的一个实际应用场景就是无人驾驶，如果能够在无人车上装载一个有效的目标检测系统，那么无人车将和人一样有了眼睛，可以快速地检测出前面的行人与车辆，从而作出实时决策。

计算机视觉任务（来源: cs231n）

在深度学习出现之前，传统的目标检测方法大概分为区域选择（滑窗）、特征提取（SIFT、HOG等）、**分类器（SVM、Adaboost等）**三个部分，其主要问题有两方面：一方面滑窗选择策略没有针对性、时间复杂度高，窗口冗余；另一方面手工设计的特征鲁棒性较差。自深度学习出现之后，目标检测取得了巨大的突破，最瞩目的两个方向有：

以RCNN为代表的基于Region Proposal的深度学习目标检测算法（RCNN，SPP-NET，Fast-RCNN，Faster-RCNN等），它们是two-stage的，需要先使用启发式方法（selective search）或者CNN网络（RPN）产生Region Proposal，然后再在Region Proposal上做分类与回归。
以YOLO为代表的基于回归方法的深度学习目标检测算法（YOLO，SSD等）,其仅仅使用一个CNN网络直接预测不同目标的类别与位置。

本篇笔记先来介绍什么是传统目标检测。

什么是传统目标检测？

![LocalizationDetection.png-196.1kB][1]

首先我们先来了解一下什么是目标检测？简单来说就是把存在的目标从图片中找到并识别出来。我们发现这对于我们人来说十分简单，但对于计算机而言，它是怎么做到的呢？
传统目标检测方法分为三部分：区域选择 → 特征提取 → 分类器
即首先在给定的图像上选择一些候选的区域，然后对这些区域提取特征，最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。

区域选择

这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置，而且目标的大小、长宽比例也不确定，所以最初采用滑动窗口的策略对整幅图像进行遍历，而且需要设置不同的尺度，不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置，但是缺点也是显而易见的：时间复杂度太高，产生冗余窗口太多，这也严重影响后续特征提取和分类的速度和性能。（实际上由于受到时间复杂度的问题，滑动窗口的长宽比一般都是固定的设置几个，所以对于长宽比浮动较大的多类别目标检测，即便是滑动窗口遍历也不能得到很好的区域）