06 MMDetection

最新推荐文章于 2024-06-07 13:18:22 发布

小小爬虫

最新推荐文章于 2024-06-07 13:18:22 发布

阅读量109

点赞数 1

分类专栏： Openmmlab学习文章标签：计算机视觉深度学习目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44785633/article/details/131101499

版权

Openmmlab学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

记录时间：2023年6月8日
教程

总体内容

在这里插入图片描述

目标检测 VS 图像分类

在这里插入图片描述
根据之前的课程，感觉 目标分类——>目标检测——>姿态估计 是一个递进关系。

目标检测应用

人脸识别
智慧城市
自动驾驶
下游视觉任务

目标检测技术演进

在这里插入图片描述
Open Vocab Detection为业界的最新研究方向

基本概念

框

在这里插入图片描述

交并比

在这里插入图片描述

感受野

在这里插入图片描述

感受野的中心与步长

在这里插入图片描述

有效感受野

在这里插入图片描述

置信度

图中包含了目标检测中的两类置信度计算方法
在这里插入图片描述

目标检测问题难点

在这里插入图片描述
已经具备了识别并分类物体的能力，难点在于物体的定位

基本范式

一个好的检测器应该满足不重不漏的要求

滑窗

设定一个固定大小的窗口
遍历图像所有位置，所到之处所用的分类模型识别窗口中的内容
为了检测不同大小、不同形状的物体，可以使用不同大小、长宽比的窗口扫描图片

问题

计算成本过大

改进思路

使用启发式算法替换暴力遍历，比如Faster-RCN，但现在已经不再使用。问题1：啥叫启发式算法？
减少冗余计算，使用密集预测。在滑窗算法中，一个图像的许多部分被一个同样的卷积核卷了好多次，是重复的计算，因此如果可以将这些重复的计算消去，则可以大大提升效率。考虑是否可以一次性计算所有的特征，再取出对应位置的特征进行分类。由原图滑窗改进为特征图滑窗。

卷积存在位置不变性

边界框回归

在这里插入图片描述

方法一：基于锚框

在这里插入图片描述

方法二：无锚框

在这里插入图片描述

非极大值抑制

在这里插入图片描述

密集预测基本流程

在这里插入图片描述

密集预测模型训练

在这里插入图片描述

匹配

由于数据标注基本上都是稀疏标注，因此如何基于稀疏的标注结果去产生一个密集的ground truth。
在这里插入图片描述

密集预测基本范式

在这里插入图片描述

多尺度预测

多尺度预测是对密集预测的改进，主要是指不同的大小的物体的预测。在朴素的密集检测中，受限于结构，更加擅长中等大小的物体，对于小物体检测能力较弱，定位精度低。如何同时定位小尺度与大尺度物体呢？

基于锚框（Anchor）

在这里插入图片描述

图像金字塔

在这里插入图片描述

基于层次化特征

在这里插入图片描述

特征金字塔（FPN）

在这里插入图片描述

单阶段目标检测算法选讲

在这里插入图片描述

Refion Proposal Network(2015)

**论文：**Deep residual learning for image recognition(CVPR 2015)
在这里插入图片描述

YOLO:You Only Look Once(2015)

在这里插入图片描述

SSD:Single Shot MultiBox Detector(2016)

在这里插入图片描述

RetinaNet(2017)

FPN从此成为检测算法的标准模块
论文：Focal loss for dense object detection (ICCV 2017)
在这里插入图片描述

YOLO v3

在这里插入图片描述

YOLO v5

在这里插入图片描述

无框目标检测算法

在这里插入图片描述

Fully Convolutional One-Stage,FCOS (2019)

在这里插入图片描述

CenterNet （2019）

论文：Objects as points (arXiv)
在这里插入图片描述

YOLO X(2021)

论文：Yolox:Exceeding yolo series in 2021.
在这里插入图片描述

YOLO v8(2022)

总结

在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
06 MMDetection

记录时间：2023年6月8日教程根据之前的课程，感觉目标分类——>目标检测——>姿态估计是一个递进关系。Open Vocab Detection为业界的最新研究方向图中包含了目标检测中的两类置信度计算方法已经具备了识别并分类物体的能力，难点在于物体的定位一个好的检测器应该满足不重不漏的要求设定一个固定大小的窗口遍历图像所有位置，所到之处所用的分类模型识别窗口中的内容为了检测不同大小、不同形状的物体，可以使用不同大小、长宽比的窗口扫描图片计算成本过大使用启发式算法替换暴力遍历，比如Fa
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。