本文根据论文:Object Detection in 20 Years: A Survey 撰写,其中关于深度学习方面的目标检测算法我都会附上原论文的链接以及一些我认为写的还不错的博客。
1、目标检测20年发展历程
目标检测的发展历程主要分为两个阶段:传统目标检测方法、基于深度学习的目标检测方法。
传统目标检测方法主要有三个:Viola Jones Detectors、HOG Detector、Deformable Part-based Model (DPM)。
基于深度学习的目标检测方法又有两个分支,分别是双阶段检测、单阶段检测器。
1.1 双阶检测器
R-CNN
R-CNN在2014年由R. Girshick等人提出,作为第一个使用卷积神经网络提取图像特征的目标检测算法,奠定了深度学习在目标检测的统治地位,其背后的思想很简单:它首先在原图上提取一组对象候选框。然后将每个候选框重新缩放为固定大小的图像,并输入到ImageNet上训练的CNN模型中以提取特征。 最后,将提取出来的特征送给线性SVM分类器用于预测每个区域内对象的存在并识别对象类别。
RCNN在VOC07数据集上的表现(mAP)从之前最好传统目标检测算法的33.7%直接提升到58.3%。但是R-CNN有个很大的缺点