基于深度模型的对象检测综述:RCNN,Fast RCNN,Faster ECNN, R-FCN,以及SSD1
前言
随着自动驾驶汽车,智能视频监控,人脸检测和各种人员计数应用的兴起,对快速,准确的对象检测系统的需求日益增长。这些系统不仅涉及识别和分类图像中的每个对象,还涉及通过在图像周围绘制适当的边界框来对每个对象进行定位。与传统的计算机视觉的前身,图像分类相比,对象检测成为一项艰巨的任务。
但是,幸运的是,当前最成功的对象检测方法也是图像分类模型的扩展。Google Tensorflow 发布了新的对象检测API,附带了一些特定模型的结构和预训练模型(原论文请点击相应链接):
- Single Shot Multibox Detector (SSD) with MobileNets
- SSD with Inception V2
- Region-Based Fully Convolutional Networks (R-FCN) with