detection 基础

本文介绍了OpenMMLab中的MMDet目标检测库,涵盖sliding window检测方法及其改进,包括RCNN和YOLO系列的发展。文章还探讨了Anchor、Anchor Free以及Detection Transformer技术,并讨论了评估指标如IoU和F1-Score。
摘要由CSDN通过智能技术生成

OpenMMLab 学习三: MMDet 检测


边界框(Bounding Box):框,泛指矩形框;边界框,物体的外接矩阵框。一般由左上右下(l, t, r, b)或中心坐标及宽高(x, y, w, h)

区域(Area):同边界框

感兴趣区域(Region of interest,ROI):需要进一步检测框中是否有物体

锚框(Anchor Box):预设的基本框,类似滑窗(部分算法会依赖锚框去预测边界框)

交并比(IoU):为两个矩形的交集面积与并集的面积比值(∈ [0, 1])

置信度(Confidence Score):模型认为自身预测结果的程度

非极大值抑制(Non-Maximum Suppression,NMS):再物体周围会存在多个相近的检测框,而且这些框都指向同一物体,这时只需保留其置信度最高的

边界框回归(Bounding Box Regression):在预测物体类别时,同时计算预测边界框和边界框的偏移量

边界框编码(Bbox Coding):边界框的偏移量在数值上一般较大(不利于训练),通常需要对偏移量进行编码(有点类似缩放)


目标检测

sliding window

步骤
  1. 设定固定大小的窗口

  2. 遍历图像(类似卷积),将框内图像进行图像分类

在这里插入图片描述

为了可以检测不同物体,可以改变窗口的大小、宽高比。

缺陷:效率很慢,因为滑窗较多推理一张图片通常要进行成千上万次的图像分类。

改进方案
  1. 区域提议(RCNN)

  2. 消除滑窗重复,使用卷积计算所有特征,再对特征进行滑窗识别(减少重复区域,降低窗口个数从而提升效率,Fast RCNN)

  3. 密集预测(滑窗卷积一起做,YOLO)

演变

Tow Stage
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值