目标检测综述
一、two-stage
1、R-CNN (2014 CVPR)
论文名称:Rich feature hierarchies for accurate oject detection and semantic segmentation
论文地址: http://www.rossgirshick.info/#girshick2014rcnn.
代码链接:https://github.com/rbgirshick/rcnn
R-CNN 需要利用候选区域方法创建ROI (大约2000)。这些区域都会被转换为固定尺寸的图像,并分别送到卷积神经网络中,随后使用SVM对区域进行分类,然后使用线性回归损失来校正边界框,以实现目标分类并得到边界框:
2、Fast R-CNN (2015 ICCV)
论文名称:Fast R-CNN
论文地址:https://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Girshick_Fast_R-CNN_ICCV_2015_paper.pdf
代码链接:https://github.com/rbgirshick/fast-rcnn
网络输入的是原图像和对应的region proposal,而不是将region proposal对应的图像分别输入网路。
3、Faster R-CNN (2015 NIPS)
论文名称:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文地址:https://arxiv.org/pdf/1506.01497.pdf
代码链接:https://github.com/rbgirshick/py-faster-rcnn
Faster R-CNN 的流程图与 Fast R-CNN 基本相同,只是使用RPN代替了原来的外部候选区域方法
RPN:
总结:提速生成检测框的过程,旨在将其发展为一个端到端的网络
二、one-stage
1、SSD
论文名称:SSD: Single Shot MultiBox Detector
论文地址:https://arxiv.org/abs/1512.02325
代码链接:https://github.com/midasklr/SSD.Pytorch
没有生成 proposal 的过程,直接利用卷积预测位置和类别