深度学习-目标检测

一、目标检测可用的数据集

1.VOC数据集:PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。

2.COCO数据集:起源于微软2014年出资标注的MS COCO数据库。

二、目标检测的Ground Truth

1.YOLO(TXT)格式: (x,y,w,h) 分别代表中心点坐标和宽、高,其中 x,y,w,h均为归一化结果

2.VOC(XML)格式: (Xmin,Ymin,Xmax,Ymax)分别代表左上角和右下角的两个坐标。

3.COCO(JSON)格式: (Xmin, Ymin, W, H),其中x,y,w,h均不是归一化后的数值,分别代表左上角坐标和宽、高。

三、目标检测的评估指标

1.生成的预测结果会非常多

   首先过滤掉低类别置信度的检测结果

   使用IoU作为边界框正确性的度量指标

2.AP计算方法:11点法。


 

四、目标检测的传统方法

1.滑动窗口法

五、目标检测的深度学习方法

1.anchor box

anchor box用ratio+scale描述

feature map的点来决定位置

scale来表示目标的大小(面积大小)

aspect ratio来表示目标的形状(长宽比)

2.anchor-base和anchor-free

(1)anchor-base是自顶向下的 类似于传统方法,滑动窗口法穷举出许多,然后再根据置信度之类的进行筛选。

(2)anchor-free anchor-free是自底向上的 想办法自动生成,不穷举 free掉了anchor的预设过程。

3.two stage算法流程

常见two stage算法

(1)经典发展线:R-CNN、SPP-Net、Fast R-CNN、  Faster R-CNN

(2)其他:Cascade R-CNN、Guided Anchoring

4.one stage算法流程

常见one stage算法

(1)YOLO系列:YOLO v1-v5

(2)SSD系列:SSD、DSSD、FSSD

(3)其他经典:RefineDet

5.非极大值抑制(Non-maximum suppression,NMS)

(1)设定目标框的置信度阈值,常用的阈值是0.5左右。

(2)根据置信度降序排列候选框列表 选取置信度最高的框A添到输出列表,将其从候选框列表删除。

(3)候选框列表中的所有框依次与A计算IoU,删除大于阈值的候选框。

(4)重复上述过程,直到候选框列表为空,返回输出列表。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值