06 MMDetection

记录时间:2023年6月8日
教程

总体内容

在这里插入图片描述

目标检测 VS 图像分类

在这里插入图片描述
根据之前的课程,感觉 目标分类——>目标检测——>姿态估计 是一个递进关系。

目标检测应用

  1. 人脸识别
  2. 智慧城市
  3. 自动驾驶
  4. 下游视觉任务

目标检测技术演进

在这里插入图片描述
Open Vocab Detection为业界的最新研究方向
在这里插入图片描述

基本概念

在这里插入图片描述

交并比

在这里插入图片描述

感受野

在这里插入图片描述

感受野的中心与步长

在这里插入图片描述

有效感受野

在这里插入图片描述

置信度

图中包含了目标检测中的两类置信度计算方法
在这里插入图片描述

目标检测问题难点

在这里插入图片描述
已经具备了识别并分类物体的能力,难点在于物体的定位

基本范式

一个好的检测器应该满足不重不漏的要求

滑窗

  1. 设定一个固定大小的窗口
    在这里插入图片描述

  2. 遍历图像所有位置,所到之处所用的分类模型识别窗口中的内容
    在这里插入图片描述

  3. 为了检测不同大小、不同形状的物体,可以使用不同大小、长宽比的窗口扫描图片
    在这里插入图片描述

问题

计算成本过大

改进思路

  1. 使用启发式算法替换暴力遍历,比如Faster-RCN,但现在已经不再使用。问题1:啥叫启发式算法?

  2. 减少冗余计算,使用密集预测。在滑窗算法中,一个图像的许多部分被一个同样的卷积核卷了好多次,是重复的计算,因此如果可以将这些重复的计算消去,则可以大大提升效率。考虑是否可以一次性计算所有的特征,再取出对应位置的特征进行分类。由原图滑窗改进为特征图滑窗

    卷积存在位置不变性

边界框回归

在这里插入图片描述

方法一:基于锚框

在这里插入图片描述

方法二:无锚框

在这里插入图片描述

非极大值抑制

在这里插入图片描述

密集预测基本流程

在这里插入图片描述

密集预测模型训练

在这里插入图片描述

匹配

由于数据标注基本上都是稀疏标注,因此如何基于稀疏的标注结果去产生一个密集的ground truth。
在这里插入图片描述

密集预测基本范式

在这里插入图片描述

多尺度预测

多尺度预测是对密集预测的改进,主要是指不同的大小的物体的预测。在朴素的密集检测中,受限于结构,更加擅长中等大小的物体,对于小物体检测能力较弱,定位精度低。如何同时定位小尺度与大尺度物体呢?

基于锚框(Anchor)

在这里插入图片描述

图像金字塔

在这里插入图片描述

基于层次化特征

在这里插入图片描述

特征金字塔(FPN)

在这里插入图片描述
在这里插入图片描述

单阶段目标检测算法选讲

在这里插入图片描述

Refion Proposal Network(2015)

**论文:**Deep residual learning for image recognition(CVPR 2015)
在这里插入图片描述

YOLO:You Only Look Once(2015)

在这里插入图片描述

SSD:Single Shot MultiBox Detector(2016)

在这里插入图片描述

RetinaNet(2017)

FPN从此成为检测算法的标准模块
论文:Focal loss for dense object detection (ICCV 2017)
在这里插入图片描述

YOLO v3

在这里插入图片描述

YOLO v5

在这里插入图片描述

无框目标检测算法

在这里插入图片描述

Fully Convolutional One-Stage,FCOS (2019)

在这里插入图片描述

CenterNet (2019)

论文:Objects as points (arXiv)
在这里插入图片描述

YOLO X(2021)

论文:Yolox:Exceeding yolo series in 2021.
在这里插入图片描述

YOLO v8(2022)

总结

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值