做目标检测,这一篇就够了!2019最全目标检测指南

本文是计算机视觉领域的目标检测全面介绍,涵盖R-CNN系列(Fast R-CNN, Faster R-CNN, Mask R-CNN)以及SSD(Single Shot MultiBox Detector),讨论了训练过程、效率问题,并提供了相关论文链接。" 106529693,7887578,PerfDog:Android与iOS app性能测试工具,"['性能测试', 'Android', 'iOS']
摘要由CSDN通过智能技术生成


大数据文摘出品

编译:张睿毅、宁静


计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科,它赋予机器“看”的智能,需要实现人的大脑中(主要是视觉皮层区)的视觉能力。


想象一下,如果我们想为盲人设计一款导盲产品,盲人过马路时系统摄像机拍到了如下的图像,那么需要完成那些视觉任务呢?



  1. 图像分类: 为图片中出现的物体目标分类出其所属类别的标签,如画面中的人、楼房、街道、车辆数目等;
  2. 目标检测: 将图片或者视频中感兴趣的目标提取出来,对于导盲系统来说,各类的车辆、行人、交通标识、红绿灯都是需要关注的对象;
  3. 图像语义分割: 将视野中的车辆和道路勾勒出来是必要的,这需要图像语义分割技术做为支撑,勾勒出图像物体中的前景物体的轮廓;
  4. 场景文字识别: 道路名、绿灯倒计时秒数、商店名称等,这些文字对于导盲功能的实现也是至关重要的。


以上已经囊括了计算机视觉(CV)领域的四大任务,在CV领域主要有八项任务,其他四大任务包括: 图像生成、人体关键点检测、视频分类、度量学习等。


目标检测作为CV的一大任务之一,其对于图片的理解也发挥着重要的作用,在本文中,我们将介绍目标检测的基础知识,并回顾一些最常用的算法和一些全新的方法。 (注: 每个小节展示的论文图片,均在节末给出了具体的链接


目标检测如何运作


目标检测定位图像中物体的位置,并在该物体周围绘制边界框,这通常涉及两个过程,分类物体类型,然后在该对象周围绘制一个框。 现在让我们回顾一下用于目标检测的一些常见模型架构:
  • R-CNN
  • Fast R-CNN
  • Faster R-CNN
  • Mask R-CNN
  • SSD (Single Shot MultiBox Defender)
  • YOLO (You Only Look Once)


R-CNN 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值