目标检测概览

目标检测

先安利一个我觉得很棒的视觉入门->https://zhuanlan.zhihu.com/p/27642620
还有这个->https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/

REF: https://www.cnblogs.com/xiaoboge/p/10544336.html

实现

目前计算机视觉(computer vision)与自然语言处理(Natural Language Process)及语音识别(Speech Recognition)并列为人工智能·机器学习·深度学习方向的三大热点方向 。图像分类、目标检测、分割是计算机视觉领域的三大任务。
目标检测的基本思路:同时解决定位(localization) + 识别(Recognition)。

多任务学习,带有两个输出分支。一个分支用于做图像分类,即全连接+softmax判断目标类别,和单纯图像分类区别在于这里还另外需要一个“背景”类。另一个分支用于判断目标位置,即完成回归任务输出四个数字标记包围盒位置(例如中心点横纵坐标和包围盒长宽),该分支输出结果只有在分类分支判断不为“背景”时才使用。
在这里插入图片描述
传统的目标检测框架,主要包括三个步骤:

  1. 利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域;
  2. 提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征;行人检测和普通目标检测常用的HOG特征等;
  3. 利用分类器进行识别,比如常用的SVM模型。

目前目标检测领域的深度学习方法主要分为两类:两阶段(Two Stages)的目标检测算法;一阶段(One Stage)目标检测算法。
两阶段:首先由算法(algorithm)生成一系列作为样本的候选框,再通过卷积神经网络进行样本(Sample)分类。
常见的算法有R-CNN、Fast R-CNN、Faster R-CNN等等。
一阶段:不需要产生候选框,直接将目标框定位的问题转化为回归(Regression)问题处理(Process)。
常见的算法有YOLO、SSD等等。

基于候选区域,如R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN;
基于端到端,无需候选区域的,如YOLO、SSD。

对于上述两种方式,基于候选区域的方法在检测准确率和定位精度上占优,基于端到端的算法速度占优。
相对于R-CNN系列的“看两眼”(候选框提取和分类),YOLO只需要“看一眼”。
总之,目前来说,基于候选区域的方法依然占据上风,但端到端的方法速度上优势明显,至于后续的发展让我们拭目以待。

发展历程

以下是大神们整理的: https://github.com/hoya012/deep_learning_object_detection/blob/master/README.md

在这里插入图片描述

DetectorVOC07 (mAP@IoU=0.5)VOC12 (mAP@IoU=0.5)COCO (mAP@IoU=0.5:0.95)Published In
R-CNN58.5--CVPR’14
SPP-Net59.2--ECCV’14
MR-CNN78.2 (07+12)73.9 (07+12)-ICCV’15
Fast R-CNN70.0 (07+12)68.4 (07++12)19.7ICCV’15
Faster R-CNN73.2 (07+12)70.4 (07++12)21.9NIPS’15
YOLO v166.4 (07+12)57.9 (07++12)-CVPR’16
G-CNN66.866.4 (07+12)-CVPR’16
AZNet70.4-22.3CVPR’16
ION80.177.933.1CVPR’16
HyperNet76.3 (07+12)71.4 (07++12)-CVPR’16
OHEM78.9 (07+12)76.3 (07++12)22.4CVPR’16
MPN--33.2BMVC’16
SSD76.8 (07+12)74.9 (07++12)31.2ECCV’16
GBDNet77.2 (07+12)-27.0ECCV’16
CPF76.4 (07+12)72.6 (07++12)-ECCV’16
R-FCN79.5 (07+12)77.6 (07++12)29.9NIPS’16
DeepID-Net69.0--PAMI’16
NoC71.6 (07+12)68.8 (07+12)27.2TPAMI’16
DSSD81.5 (07+12)80.0 (07++12)33.2arXiv’17
TDM--37.3CVPR’17
FPN--36.2CVPR’17
YOLO v278.6 (07+12)73.4 (07++12)-CVPR’17
RON77.6 (07+12)75.4 (07++12)27.4CVPR’17
DeNet77.1 (07+12)73.9 (07++12)33.8ICCV’17
CoupleNet82.7 (07+12)80.4 (07++12)34.4ICCV’17
RetinaNet--39.1ICCV’17
DSOD77.7 (07+12)76.3 (07++12)-ICCV’17
SMN70.0--ICCV’17
Light-Head R-CNN--41.5arXiv’17
YOLO v3--33.0arXiv’18
SIN76.0 (07+12)73.1 (07++12)23.2CVPR’18
STDN80.9 (07+12)--CVPR’18
RefineDet83.8 (07+12)83.5 (07++12)41.8CVPR’18
SNIP--45.7CVPR’18
Relation-Network--32.5CVPR’18
Cascade R-CNN--42.8CVPR’18
MLKP80.6 (07+12)77.2 (07++12)28.6CVPR’18
Fitness-NMS--41.8CVPR’18
RFBNet82.2 (07+12)--ECCV’18
CornerNet--42.1ECCV’18
PFPNet84.1 (07+12)83.7 (07++12)39.4ECCV’18
Pelee70.9 (07+12)--NIPS’18
HKRM78.8 (07+12)-37.8NIPS’18
M2Det--44.2AAAI’19
R-DAD81.2 (07++12)82.0 (07++12)43.1AAAI’19

在这里插入图片描述
目标检测要解决的核心问题是:

  1. 目标可能出现在图像的任何位置。
  2. 目标有各种不同的大小。
  3. 目标可能有各种不同的形状。

主流算法详解

接触目标检测有一定的时间,将读过做过的一些内容做个总结:(好吧也是先挖个坑我会填的)

了解这些最好的方法还是去读paper和code,而且真的需要反复的读
完整的paper:https://blog.csdn.net/junmuzi/article/details/53418782
https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html

RCNN
Fast-RCNN
Faster-RCNN
RCNN系列

SSD

YOLOv1
YOLOv2(YOLO9000)
YOLOv3

MobileNet   还有这个
other details

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值