【OpenMMLab】打卡笔记4 -- 目标检测

目标检测技术的演进

在这里插入图片描述
在这里插入图片描述

基础知识

  • 边界框(Bounding Box)
  1. 区域(Region):框的同义词
  2. 区域提议(Region Proposal, Proposal):指算法预测的可能包含物体的框,某种识别能力不强的算法的初步预测结果
  3. 感兴趣区域(Region of Interest, RoI):当我们谈论需要进一步检测这个框中是否有物体时,通常称框为感兴趣区域
  4. 锚框(Anchor Box, Anchor):图中预设的一系列基准框,类似滑窗,一些检测算法会基于锚框预测边界框
  • 交并比 Intersection Over Union

交并比(IoU)定义为两矩形框交集面积与并集面积之比,是矩形框重合程度的衡量指标

  • 置信度 Confidence Score

模型认可自身预测结果的程度,通常需要为每个框预测一个置信度,人们倾向认可置信度高的预测结果

  • 非极大值抑制 Non-Maximum Suppression

滑窗类算法通常会在物体周围给出多个相近的检测框,这些框实际指向同一物体,只需要保留其中置信度最高的

  • 边界框回归 Bounding Box Regression

让模型在预测物体类别同时预测边界框相对于滑窗的偏移量

  • 边界框编码 Bbox Coding

边界框的绝对偏移量在数值上通常较大,不利于神经网络训练,通常需要对偏移量进行编码,作为回归模型的预测目标

两阶段目标检测算法

  • Region-based CNN (2013)在这里插入图片描述
  • Fast R-CNN (2014)在这里插入图片描述
  • Faster R-CNN (2015)在这里插入图片描述
  • 两阶段方法的发展与演进 (2013~2017)在这里插入图片描述

多尺度检测技术

  • 特征金字塔网络 Feature Pyramid Network (2016)在这里插入图片描述
  • 在 Faster R-CNN 模型中使用 FPN在这里插入图片描述

单阶段目标检测算法

  • YOLO: You Only Look Once (2015)在这里插入图片描述
  • SSD: Single Shot MultiBox Detector (2016)在这里插入图片描述
  • RetinaNet (2017)在这里插入图片描述
  • YOLO v3 (2018)在这里插入图片描述

无锚框目标检测算法

  • 锚框 vs 无锚框在这里插入图片描述
  • FCOS, Fully Convolutional One-Stage (2019)在这里插入图片描述
  • CenterNet (2019)在这里插入图片描述

Detection Transformers

  • DETR (2020)在这里插入图片描述
  • Deformable DETR (2021)在这里插入图片描述

目标检测模型的评估方法

  • 检测结果的正确/错误类型

在这里插入图片描述

  • 准确率 Precision 与 召回率 Recall

在这里插入图片描述

  • PR 曲线 与 AP 值

在这里插入图片描述

  • Mean AP

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值