[阅读笔记] For:Object Detection with Deep Learning: The Definitive Guide

文章指路:Object Detection with Deep Learning: The Definitive Guide

1 对比其他计算机视觉问题

1.1 图像分类

算是计算机视觉里比较著名的问题了,即一张图对应于多个类别概率,并取最高者为该图的标签。学术界内最为著名的一个数据集为 ImageNet 以及 它的竞赛 ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 。机遇与挑战并存。

1.2 目标定位

在解决生活中某些问题时比较实用,比如智能裁剪,裁剪出我们感兴趣的区域。

1.3 目标检测

将分类(对物体的分类)与定位结合起来,其实就是目标检测的任务。

1.4 实例分割

比目标检测更进一步,想要实现像素到像素的分类。

2 目标检测的一些应用场景

2.1 人脸检测

已经可以很方便地应用在摄像头上,检测人脸可以方便拍照时自动对焦,进一步可以实现人脸识别。

2.2 计数

比如人群计数,车流计数,农作物计数等等,可以将计算机视觉所见的原始数据转化为结构化数据。与无人机/卫星结合,可以看到更广更远,实现更丰富的计数应用。

2.3 搜索引擎

当你浏览某类商品时,它能自动化推荐出其他同类的商品,那么自然就是通过在各个地方检测出同类商品,并收集过来显示在页面上。

3 要实现目标检测所要面临的问题

1)多目标:不同于图像分类,目标检测面临的可能是大量的待检测的物体
2)多尺度:这些物体可能占据整张图片,也可能小到十几像素
3)多任务:一个模型要同时实现分类+定位的任务
4)数据集:数据集的好坏也决定了模型的好坏,但是构建数据集的成本较大

4 基于深度学习的目标检测

4.1 传统机器学习方法

1)定位:滑动窗口
2)提取特征:HOG,SIFT
3)分类:SVM
这里不进一步展开

4.2 深度学习模型

百家争鸣
1)OverFeat:提出了一种使用卷积神经网络 (CNN) 的多尺度滑动窗口算法。
2)R-CNN:将CNN应用到目标检测上的开山之作,主要方法为:

  • 使用SS算法生成推荐区域
  • 使用CNN提取特征
  • 使用SVM作分类

问题:训练复杂;没有较好的分类方法;内部模型分离。

3)Fast R-CNN:R-CNN系列第二作,将分类与回归和特征提取网络耦合,接近于端到端(end-to-end)。
问题:区域框的生成算法是瓶颈。

4)Faster R-CNN:R-CNN系列第三作,其实就是RPN(Region Proposal Network)+Fast R-CNN。

5)YOLO系列:兼顾实时性和准确率的模型,是one-stage类型算法。

6)此外还有SSD,R-FCN等模型。

5 总结

总之,有问题存在,就意味着目标检测领域还有很大的上升空间,机遇与挑战并存,了解完前人的智慧后,站在巨人的肩膀上,将会有更多新方法诞生。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值