什么是目标检测--Object Detection

目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。目标检测不仅要用算法判断图片中物品的分类, 还要在图片中标记出它的位置, 用边框或红色方框把物品圈起来, 这就是目标检测问题。 

目标检测从2001年开始,在2012年成为分水岭,因为这一年基于深度学习的目标检测方法,逐渐使目标检测进入到快速发展的阶段,比较流行的算法可以分为两类,一类是基于Region Proposal的R-CNN系算法(RCNN、SPPNet、FasterRCNN、Pyramid NetWorks等),它们是two-stage的,需要先算法产生目标候选框,也就是目标位置,然后再对候选框做分类与回归。而另一类是Yolo,SSD这类one-stage算法,其仅仅使用一个卷积神经网络CNN直接预测不同目标的类别与位置。第一类方法是准确度高一些,但是速度慢,但是第二类算法是速度快,但是准确性要低一些。

一、统一的实时的目标检测

yolo将特征图划分为SXS的格子,每个格子负责对落入其中的目标进行检测,一次性预测所有格子所含目标不的边界框、定位置信度以及所有类别概率向量。

yolo算法的基本思想

(1)预测特征图

(2)多尺度整合

(3)锚框机制(Anchor)

通过特征提取网络对输入的图像进行特征提取,得到一定大小的特征图

预测得到的输出特征图有两个维度是摄取到的特征维度。

(1)非极大值抑制(NMS--Non-Maximum Suppression)

(2)损失函数(Loss Function)

包括:分类损失、定位损失、置信度损失

总的损失函数=分类损失+定位损失+置信度损失

二:目标检测的性能

检测精度检测速度
Precision,Recall,F1 Score前传耗时
IoU(交并比)FPS(每秒帧数)
P-R curve浮点运算量(Flops)
AP(Average Precision)
mAP(mean Average Precision)

(一)精度

1、什么是混淆矩阵

精度:Precision=TP/(TP+FP)

召回率:Recall=TP/(TP+FN)

F1 score=2*Precision*Recall/(Precision+Recall)

2、IoU(交并比)

3、AP与mAP

AP衡量的是学习出来的模型在每个类别上的好坏。

mAP衡量的是学出来的模型在所有类别上的好坏,是所有类别AP的平均值。

(二)检测速度

1、前传耗时(ms):从输入的一张图像到输出最终检测结果所消耗的时间。

2、每秒帧数(FPS):每秒钟能处理的图像数量。

3、浮点运算量(FLOPS):处理的每一张图像所需要的浮点运算数量。

三:目标检测数据集

1、Pascal Voc

Pacal VOC挑战赛在2005年-2012年间展开,共有两个数据集 Pascal VOC2007(9963张图像,24640个标注)和Pascal VOC2012(11530张图像,27450个标注),该数据集有20个分类。

2、MS COCO

起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。COCO数据集包含20万个图像,其中11.5万张训练集图像,5千张验证集图像,2万多张测试集图像。80个类别中有超过50万个目标标注。

COCO竞赛成为当前目标识别和检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上能唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀企业共同参与的大赛。

网站地址:http://cocodataset.org

四:目前国内主流的目标检测技术:

1、YOLOX:由中国的旷视科技研发,是目前国际上运行速度最快的一种深度学习模型。

2、YOLOV1-V5:Yolov1-yolov3由Joseph Redmon研发,yolov4-yolov5则是由yolo团队内部成员完成的。

3、Transformer:原来是做为语音识别的一个模型,现在用在图像的目标识别上面也有不俗的表现

4、ViT:当考虑预训练模型的计算成本时,ViT的性能非常好,以较低的预训练成本在大多数识别基准上达到了最先进的水平。

以下为课程预告,我们将遂一的为大家介绍以上目标检测技术,有兴趣的小伙伴可以关注我的微博,我将随时公布培训时间及报名方式。

  • 8
    点赞
  • 66
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BBM的开源HUB

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值