【OpenMMLab 2023 Course】Lecture 4

Oscillated

已于 2023-02-08 15:53:05 修改

阅读量84

点赞数

分类专栏： OpenMMLab 2023 Course 文章标签：目标检测深度学习计算机视觉

于 2023-02-07 15:02:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43287837/article/details/128917283

版权

OpenMMLab 2023 Course 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章介绍了目标检测任务的基本概念，包括滑窗方法、两阶段和单阶段目标检测算法，如RCNN、FasterR-CNN、YOLO、SSD等。还提到了无锚框检测算法如FCOS和CenterNet，以及Transformers在目标检测领域的应用，如DETR和DeformableDETR。最后，讨论了目标检测模型的评估指标，如AP和MeanAP。

摘要由CSDN通过智能技术生成

目标检测与MMDetection

目标检测任务介绍
基础知识

目标检测任务介绍

物体的数量/位置/大小均不固定

滑窗 Sliding Window

设定一个固定大小的窗口
遍历图像所有位置，用分类模型识别窗口中的内容
为了检测不同大小、不同形状的物体，可以使用不同大小、长宽比的窗口扫描图片

问题：计算成本不可接受
改进：
1. 使用启发算法替换暴力遍历（RCNN、Fast RCNN中的Selective Search）
2. 使用CNN一次性计算所有特征，再取出对应位置的特征完成分类（目前常见）

密集预测

使用不同感受野的CNN生成一系列特征

基本范式

图像 - 主干网络backbone - 检测头head - 背景/物体

两阶段方法：以某种方式产生窗，再基于窗口内的特征进行预测
单阶段方法：在特征图上基于单点特征实现密集预测

基础知识

框/区域、边界框
区域提议网络
感兴趣区域
锚框anchor
交并比Intersection over Union
置信度Confidence Score
非极大值抑制Non-Maximum Suppresion
边界框回归
边界框编码

两阶段目标检测算法

RCNN：慢
Fast RCNN：ROL Pooling/ROL Align
Faster RCNN：锚框anchor、区域提议网络RPN、特征金字塔网络FPN
Mask RCNN
近年逐渐被单阶段算法取代

单阶段目标检测算法

直接通过密集预测产生检测框

需要专门处理样本不均衡问题

YOLO：快
SSD：困难负样本挖掘（样本不均衡问题）
RetinaNet：focal loss
YOLOv3：三级特征图、三个尺寸的锚框

无锚框目标检测算法

FCOS：多级特征图
CenterNet：以中心点表示物体

Transformers

DETR：将检测建模为从特征序列到框序列的翻译问题
Deformable DETR：显示建模 query 注意的位置，收敛速度更快

目标检测模型的评估算法

“准确-召回”曲线
AP：PR曲线下的面积
Mean AP：分类别统计AP后取平均

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【OpenMMLab 2023 Course】Lecture 4

OpenMMLab 2023 AI实战营第四课
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。