目标检测-前沿及研究背景

最新推荐文章于 2025-02-12 00:15:00 发布

_yoking_____

最新推荐文章于 2025-02-12 00:15:00 发布

阅读量919

点赞数

文章标签：目标检测深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40661227/article/details/129646822

版权

😾😾😾

目标检测-前沿及研究背景

一、目标检测任务简述
二、目标检测重要工作回顾（简述）

一、目标检测任务简述

在这里插入图片描述

目标检测关注特定的物体目标，要求同时获得这一目标的类别信息和位置信息。相比分类，检测给出的是对图片前景和背景的理解，我们需要从背景中分离出感兴趣的目标，并确定这一目标的描述（类别和位置），因而，检测模型的输出是一个列表，列表的每一项使用一个数据组给出检出目标的类别和位置（常用矩形检测框的坐标表示）。

二、目标检测重要工作回顾（简述）

1.两阶段（2-stage）检测模型

1）R-CNN

论文链接：Rich feature hierarchies for accurate object detection and semantic segmentation

在这里插入图片描述

R-CNN主要有两个贡献：

CNN可用于基于区域的定位和分割物体
监督训练样本数紧缺时，在额外的数据上预训练的模型经过fine-tuning可以取得很好的效果

R-CNN算法流程：

一张图像生成1K～2K个候选区域（使用Selective Search算法）
对每个候选区域，使用深度网络提取特征（CNN）
特征送入每一类的SVM分类器，判断是否属于该类
使用回归器精细修正候选框位置

几个重要的概念：
- SS算法：Select Search算法
- NMS(Non Maximum Suppression)非极大值抑制：NMS
- 边界框回归：Bounding-Box regression
- mAP

R-CNN算法不足之处：

需要处理的上千的候选框，而很大一部分候选框的特征使用CNN提取都是冗余的
建议框只提供了粗略的定位，还需要经过边界框回归来进一步精确

2）Fast R-CNN

论文链接：Fast R-CNN
在这里插入图片描述

Fast R-CNN贡献如下：

使目标检测的mAp更高
训练过程是单阶段，使用多任务损失

Fast R-CNN算法流程：

一张图像生成1K～2K个候选区域（使用Selective Search算法）
将图像输入网络得到相应的特征图，将SS算法生成的候选框投影到特征图上得到相应的特征矩阵
将每个特征矩阵RoI pooling层缩放到7x7大小的特征图，接着将特征图展平通过一系列全连接层得到预测结果

3）Faster R-CNN

论文链接：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

在这里插入图片描述

Faster R-CNN贡献如下：

提出Regional Proposal Networks（RPN）

Faster R-CNN算法流程：

将图像输入网络得到相应的特征图
使用RPN结构生成候选框，将RPN生成的候选框投影到特征图上获得相应的特征矩阵
将每个特征矩阵通过RoI pooling层缩放到7x7大小的特征图，接着将特征图展平通过一系列全连接层得到预测结果

2.一阶段（1-stage）检测模型

单阶段模型没有中间的区域检出过程，直接从图片获得预测结果，也被成为Region-free方法。

1）YOLO(You Only Look Once)

论文链接：You Only Look Once: Unified, Real-Time Object Detection

2）SSD(Single Shot Multibox Detector)

论文链接：SSD: Single Shot MultiBox Detector

参考：
格灵深瞳DeepGlint - 干货 | 目标检测入门，看这篇就够了

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。