detection 基础

最新推荐文章于 2024-07-11 23:31:47 发布

Crazy - ?

最新推荐文章于 2024-07-11 23:31:47 发布

阅读量78

点赞数

文章标签：深度学习计算机视觉目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46310125/article/details/128919393

版权

本文介绍了OpenMMLab中的MMDet目标检测库，涵盖sliding window检测方法及其改进，包括RCNN和YOLO系列的发展。文章还探讨了Anchor、Anchor Free以及Detection Transformer技术，并讨论了评估指标如IoU和F1-Score。

摘要由CSDN通过智能技术生成

OpenMMLab 学习三: MMDet 检测

边界框（Bounding Box）：框，泛指矩形框；边界框，物体的外接矩阵框。一般由左上右下（l, t, r, b）或中心坐标及宽高（x, y, w, h）

区域（Area）：同边界框

感兴趣区域（Region of interest，ROI）：需要进一步检测框中是否有物体

锚框（Anchor Box）：预设的基本框，类似滑窗（部分算法会依赖锚框去预测边界框）

交并比（IoU）：为两个矩形的交集面积与并集的面积比值（∈ [0, 1]）

置信度（Confidence Score）：模型认为自身预测结果的程度

非极大值抑制（Non-Maximum Suppression，NMS）：再物体周围会存在多个相近的检测框，而且这些框都指向同一物体，这时只需保留其置信度最高的

边界框回归（Bounding Box Regression）：在预测物体类别时，同时计算预测边界框和边界框的偏移量

边界框编码（Bbox Coding）：边界框的偏移量在数值上一般较大（不利于训练），通常需要对偏移量进行编码（有点类似缩放）

目标检测

sliding window

步骤

设定固定大小的窗口
遍历图像（类似卷积），将框内图像进行图像分类

在这里插入图片描述

为了可以检测不同物体，可以改变窗口的大小、宽高比。

缺陷：效率很慢，因为滑窗较多推理一张图片通常要进行成千上万次的图像分类。

改进方案

区域提议（RCNN）
消除滑窗重复，使用卷积计算所有特征，再对特征进行滑窗识别（减少重复区域，降低窗口个数从而提升效率，Fast RCNN）
密集预测（滑窗卷积一起做，YOLO）

演变

Tow Stage

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
detection 基础

目标检测介绍
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。