OpenMMLab AI实战营笔记6

MMDetection目标检测知识汇总

目标检测其实是我一直在做的方向了。听完了这节课之后,对目标检测的总体都有一个很好的梳理。因此我写一个笔记来整理我目标检测的知识。

1.Overview

  • 目标检测常用组件
  • 单阶段&无锚框算法选讲

2. 目标检测技术演进

在这里插入图片描述
目标检测算法从机器学习方法到如今使用Transformer的方法以来,发展很久。它们其中也分为关注速度的一系列算法YOLO和高精度的算法如SwinTransformer。

3.目标检测常用组件

  • 滑窗

在这里插入图片描述
滑窗其实是一种很朴素的技术方法,我们通过设定固定大小之后,在固定窗口中使用图片分类算法进行检测。但是这样遍历整张图片的算法会有很大的计算复杂度,这是我们不能接受的.

在这里插入图片描述
因此,我们使用卷积一次计算所有特征,再进行特征对应位置进行分类。这样可以提高滑窗效率。

在这里插入图片描述

  • 感受野

在这里插入图片描述
感受野可以直观的理解为,特征图上的一个点可以看到原始图片多大的范围。能看到的范围即为感受野。

  • 密集预测

在这里插入图片描述
这是在一张图片上做密集预测的pipeline

  • 边界框回归

在这里插入图片描述
一般我们定义的滑窗的大小并不一定会刚好拟合物体在图片上的大小,我们需要通过回归边界框获取真实的预测框。

  • 密集预测任务的训练

在这里插入图片描述
对于一个密集预测任务来说,我们需要在特征级别上进行Loss计算,而我们进行训练时使用的都是人工在图片上标注好的预测框。这种预测框不能直接监督图片的训练,而是需要先得到一个标注在特征图上的真值再进行训练。

  • pipeline

在这里插入图片描述
图片进行目标检测的基本流程。

4. 单目标检测网络选讲

  • RPN
    在这里插入图片描述
    第一个模型是RPN,这是一个用在Faster RCNN上的目标检测第一阶段的方法。这个方法的主要工作就是给Faster RCNN选定RoI(感兴趣区域)。

  • YOLO

在这里插入图片描述

这个模型是一个很经典的one-stage目标检测方法。

  • SSD

在这里插入图片描述
这个方法融合了多特征图而获得较好的结果

  • RetinaNet

在这里插入图片描述

5.算法总结

在这里插入图片描述
对于是否有锚框的算法来说的流程都如上图所示。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值