深度学习-目标检测

一、目标检测:识别图片中有哪些物体并且找到物体的存在位置,多任务旨在从图像或视频中找出感兴趣的目标(如人、动物、车辆等)的位置,并确定其类别。位置信息通常用边界框(bounding box)来表示,即包含目标的最小矩形区域,一般由左上角坐标和右下角坐标或者中心坐标以及宽和高来确定。可能存在目标种类与数量繁多,目标尺度不均,遮挡、噪声等外部环境。

二、应用场景:1、在安防监控领域,可以检测监控画面中的可疑人物、车辆等目标,及时发现异常行为。2、在自动驾驶中,检测道路上的行人、其他车辆、交通标志等目标,为车辆的行驶决策提供依据。3、在工业生产中,检测产品表面的缺陷或者识别生产线上的零部件种类和位置。

三、目标检测的数据集

1、VOC数据集PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。

Ø 4 大类, 20 小类
Ø VOC 2007 9963 图片         /24640 目标
Ø VOC 2012 23080 图片    /54900 目标

2、COCO数据集:起源于微软2014年出资标注的MS COCO数据库。

Ø 包含 20 万个图像
Ø 80 个类别
Ø 超过 50 万个目标标注
Ø 平均每个图像的目标数是7.2
四、目标检测的 Ground Truth
类别 + 真实边界框坐标 ( x,y,w,h )
1、YOLO(TXT)格式: (x,y,w,h) 分别代表中心点坐标和宽、高。 x ,y,w,h均为归一化结果。
2、VOC(XML)格式: (Xmin,Ymin,Xmax,Ymax)分别代表左上角和右下角的两个坐标。
3、COCO(JSON)格式: (Xmin, Ymin, W, H),其中x,y,w,h均不是归一化后的数值,分别代表左上角坐标和宽、高。
五、目标检测的评估指标
1、准确率,召回率
准确率(Precision):定义为预测正确的目标个数(真正例,True Positives)与预测出来的目标个数(真正例 + 假正例,True Positives + False Positives)的比值。它反映了检测结果中真正目标所占的比例,高准确率表示检测结果中误报(将背景检测为目标)较少。

召回率(Recall):定义为预测正确的目标个数(真正例)与图像中实际存在的目标个数(真正例 + 假反例,True Positives+False Negatives)的比值。它反映了检测算法能够检测到的目标比例,高召回率表示漏检(将目标检测为背景)较少。

2、   meanaverage
mean:算数平均
average:包含其他的度量指标

平均精度(Average Precision,AP):在不同的召回率下计算精度,并对这些精度值求平均得到平均精度。对于多类别目标检测,通常会计算每个类别的平均精度,然后再求平均得到平均精度均值(mAP,Mean Average Precision),mAP 是评估目标检测算法性能的一个重要指标。

3、交并比(Intersection over Union,IoU):用于衡量预测的边界框和真实边界框的重叠程度。计算方式为预测边界框与真实边界框的交集面积与并集面积的比值。在目标检测中,通常会设定一个 IoU 阈值(如 0.5),当预测边界框与真实边界框的 IoU 大于这个阈值时,才认为检测正确。

六、目标检测的传统方法

· 滑动窗口法:需要人工设计尺寸,大量冗余操作,定位不准确。

七、目标检测的深度学习方法

anchor box,anchor-base和anchor-free,非极大值抑制(Non-maximum suppression,NMS)

 two stage算法流程:

        经典发展线:R-CNN、SPP-NetFast R-CNN  Faster R-CNN

        其他:Cascade R-CNN、Guided Anchoring

one stage算法流程:

        YOLO系列:YOLO v1-v5

        SSD系列:SSDDSSDFSSD

        其他经典:RefineDet

其中YOLO-V1详细介绍如下

优缺点:

优点:快速,简单!

缺点1:每个Cell只预测一个类别,如果重叠无法解决

缺点2:小物体检测效果一般,长宽比可选的但单一

·核心思想:将目标检测视为回归问题,划分网格进行目标检测,多个边界框预测与置信度,类别预测基于网格。

网络架构:骨干网络,全连接层,输入与输出。

损失函数:

NMS(非极大值抑制):

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值