目标检测综述

最新推荐文章于 2020-12-16 16:34:02 发布

颐水风华

最新推荐文章于 2020-12-16 16:34:02 发布

阅读量1.9k

点赞数

分类专栏：网络架构

引用请注明出处，并免费提供别人参考。

本文链接：https://blog.csdn.net/weixin_39875161/article/details/88375439

版权

网络架构专栏收录该内容

18 篇文章

订阅专栏

本文介绍了目标检测领域的关键概念和技术发展，涵盖了从滑动窗口、SelectiveSearch到深度学习方法如YOLO、Faster R-CNN及SSD的演进过程。讨论了不同算法的优缺点，并解释了评估指标如mAP和IOU的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

常用的数据集

PASCAL VOC

PASCAL VOC--Pattern Analysisi Stattistical Modelling and Computational Learning, Visual Object Classes。名字真长~！~。它是有一套评估图像分类，检测，分割和人体姿势。跟多的用于检测，它包括4大类，20个所属类。

CUB_200_2011与CUB_200_2010

小型数据集，里面有200种鸟类相关内容。可以用来分类训练。

目标检测的方法历史

下面讲的是以cnn为基础的，目标检测--Object Detrection。

目标去检测性能的评估标准，预测的结果是否为目标--mPA(mean Average Precision)；预测框与人工标记框的重合率IOU(Intersection Over Union)。

滑动窗口--Sliding Window

思路：（A）需要一个应景训练好的分类器；(B)把图像那招一定间隔和不同的大小分成若干个窗口；（C）最后在这西窗口上进行执行分类器，得到分类较高的分数，就认为检测到物体;（D）把分类分数排序，做比如非极大值抑制（Non-Maximum Supperssion,NMS）,得到物体类别即所在图中区域。

优点：简单

缺点：耗时；对分类器的准确性依赖很严重；对分类器训练的材料要求高，不能有目标物体缺损。

所以用滑动窗口就不太现实，常见的是小型分类网络和滑动窗口法集合应用。下面是一个应用的论文。为了方便下载，我提供了论文的DOI。

Dan C Cireşan, Giusti A , Gambardella L M , et al. 
Mitosis Detection in Breast Cancer Histology Images with Deep Neural Networks[C]
// International Conference on Medical Image Computing and Computer-Assisted Intervention.
2013.
DOI：10.1007/978-3-642-40763-5_51

Selective Search

这种算法是在滑动窗口上的升级。滑动窗口在图像上检测目标的时候，会有很大部分为不存在物体的区域，这种算法实在最后可能的区域进行搜索，从而提升准确率。

思路：存在物体的区域都应存在某种相似性或者连通性的区域，超像素（正常像素点间，虚拟出很多点）合并思路。步骤如下（A）分割图片，生成很多的小区域，看作超像素（B）然后根据区域相似性来合并图像，标准主要有颜色，大小，纹理等。不断地叠加合并为大区域的过程，最后整张图会合并成一个区域。其中每个区域都有外切矩形框起来，得到目标框，叫做Region Proposal。

优点：快，有目地性，更加准确。下面是论文，同样提供了DOI。

Uijlings J R R , K. E. A. van de Sande…. 
Selective Search for Object Recognition[J]. 
International Journal of Computer Vision, 2013, 104(2):154-171.
DOI：10.1007/s11263-013-0620-5

SPP

spp，spatial pyramid pooling空间图像金字塔池。

思路：对整张图执行一次卷积的前向运算，得到最后一层的激活相图；通过某方式把·目标物体所在的区域部分的相应图拿出来，交给分类器。

这个是he kaiming研发的。他比rcnn在速度上得到巨大提升，但是继承了他的缺点，就是分段。

Fast rcnn

针对SPP这个问题，rcnn作者提出改进的方法，提取ROI特征后，把物体框的回归和分类两个任务的loss融合在一起。把SPP换成ROI池，

Faster R-CNN

r-cnn，Region-based Convolutional Neural Networks。他是通过Selective Search检测，CNN提取特征，然后分类出目标。比较常见的模型，faster r-cnn和mask r-cnn等等都是他的引深。当然Selective Search不一定准确，还要经过回归处理，修正他。

Girshick R , Donahue J , Darrell T , et al. 
Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]
// 2014 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE Computer Society, 
2014.

DOI：10.1109/CVPR.2014.81