做目标检测，这一篇就够了！2019最全目标检测指南

最新推荐文章于 2024-07-11 01:13:31 发布

BigDataDigest

最新推荐文章于 2024-07-11 01:13:31 发布

阅读量1.5k

点赞数 3

分类专栏：人工智能科技

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BigDataDigest/article/details/98055662

版权

本文是计算机视觉领域的目标检测全面介绍，涵盖R-CNN系列（Fast R-CNN, Faster R-CNN, Mask R-CNN）以及SSD（Single Shot MultiBox Detector），讨论了训练过程、效率问题，并提供了相关论文链接。" 106529693,7887578,PerfDog：Android与iOS app性能测试工具,"['性能测试', 'Android', 'iOS']

摘要由CSDN通过智能技术生成

大数据文摘出品

编译：张睿毅、宁静

计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科，它赋予机器“看”的智能，需要实现人的大脑中（主要是视觉皮层区）的视觉能力。

想象一下，如果我们想为盲人设计一款导盲产品，盲人过马路时系统摄像机拍到了如下的图像，那么需要完成那些视觉任务呢？

图像分类：为图片中出现的物体目标分类出其所属类别的标签，如画面中的人、楼房、街道、车辆数目等；
目标检测：将图片或者视频中感兴趣的目标提取出来，对于导盲系统来说，各类的车辆、行人、交通标识、红绿灯都是需要关注的对象；
图像语义分割：将视野中的车辆和道路勾勒出来是必要的，这需要图像语义分割技术做为支撑，勾勒出图像物体中的前景物体的轮廓；
场景文字识别：道路名、绿灯倒计时秒数、商店名称等，这些文字对于导盲功能的实现也是至关重要的。

以上已经囊括了计算机视觉（CV）领域的四大任务，在CV领域主要有八项任务，其他四大任务包括：图像生成、人体关键点检测、视频分类、度量学习等。

目标检测作为CV的一大任务之一，其对于图片的理解也发挥着重要的作用，在本文中，我们将介绍目标检测的基础知识，并回顾一些最常用的算法和一些全新的方法。（注： 每个小节展示的论文图片，均在节末给出了具体的链接）

目标检测如何运作

目标检测定位图像中物体的位置，并在该物体周围绘制边界框，这通常涉及两个过程，分类物体类型，然后在该对象周围绘制一个框。现在让我们回顾一下用于目标检测的一些常见模型架构：

R-CNN
Fast R-CNN
Faster R-CNN
Mask R-CNN
SSD (Single Shot MultiBox Defender)
YOLO (You Only Look Once)

R-CNN

最低0.47元/天解锁文章

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。