目标检测总结

最新推荐文章于 2024-08-29 19:36:49 发布

ryan_here

最新推荐文章于 2024-08-29 19:36:49 发布

阅读量38

点赞数

文章标签： YOLO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ryan_here/article/details/132326250

版权

本文介绍了基于深度学习的目标检测算法的两种主要类型：Two-stage（如R-CNN、Fast-RCNN和Faster-RCNN）和One-stage（如YOLO系列）。前者通过先生成区域提议再进行分类，而后者直接在网络中预测类别和位置。文中详细解释了R-CNN的工作原理，以及Fast-RCNN对候选框处理的改进。

摘要由CSDN通过智能技术生成

参考目标检测-Yolo框架_Dragon Prince的博客-CSDN博客

RCNN、Fast-RCNN、Faster-RCNN介绍_rcnn fast rcnn faster rcnn_夜半罟霖的博客-CSDN博客

基于深度学习的目标检测算法主要分为两类：Two stage和One stage。

1）Tow Stage
先进行区域生成，该区域称之为region proposal（简称RP，一个有可能包含待检物体的预选框），再通过卷积神经网络进行样本分类。

任务流程：特征提取 --> 生成RP --> 分类/定位回归。

常见tow stage目标检测算法有：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN和R-FCN等。

相对较高的检测准确率，但运行速度较慢

R-CNN (Regions with CNN features)

结构：

Region proposal module：selective search输出候选区域（缩放处理）

Feature extraction network： CNN提取特征（Alexnet）

classifier（task1）：根据CNN提取的特征做分类任务（SVM）

locator（task2）：对每类样本都单独设置回归器模型；Alexnet第五层特征作为输入，输出候选区域平移和缩放的变换系数

Fast R-CNN

warped region：对生成的候选框进行统一的缩放处理

anisotropically scales (各向异性缩放)

即不论候选框的长宽比例，直接进行缩放，这样做的虽然很方便，但候选框可能会存在严重的拉伸变形状，影响后续的特征提取效果

isotropically （各向同性缩放）【一般使用】`

如果候选框存在着长宽比例不一致的情况，则进行裁剪和填充使其比例一致。先裁剪后填充或者是先填充后裁剪都是可以的。

特征提取（CNN）

在进行特征提取时我们需要利用 CNN 为这些候选框进行打标，选择的标准就是 IOU（交并比）。当选择性搜索选出来的候选框与人工打标的候选框的 IOU 达到 0.5 以上时，这个候选框便是目标物体（正样本），否则则是负样本（背景）。

缺点：卷积层的权重无法更新

SVM 分类器和边界框回归

将 CNN 提取的特征向量输入 SVM 分类器进行分类即可得到目标物体的类别，然后对每一类目标，使用一个线性回归器对边界框位置进行精修，使其输出更为准确的边界框坐标

Fast R-CNN

Fast R-CNN 网络将整张图片和一组候选区域作为输入。先利用卷积层和最大池化产生卷积特征图，然后对于每个目标区域使用兴趣区域池化层（RoI）来从特征图中提取固定长度的特征向量。然后这些特征向量被送进全连接层产生两个并行的输出层：一个产生softmax的分类结果，另一层产生目标物体的坐标值。Fast R-CNN 的结构如下图所示：

RoI（Region of Interest）Pooling 本质上就是候选框

2）One Stage
不用RP，直接在网络中提取特征来预测物体分类和位置。

任务流程：特征提取–> 分类/定位回归。

常见的one stage目标检测算法有：OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD和RetinaNet等

在这里插入图片描述

p_c：预测结果的置信概率

b...: 边框坐标

C： one-hot分类编码

AP：P-R曲线的面积

mAP（Mean Average Precision） ：类别的平均AP

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
目标检测总结

参考基于深度学习的目标检测算法主要分为两类：Two stage和One stage。
复制链接

扫一扫

ryan_here CSDN认证博客专家 CSDN认证企业博客

码龄1年

11: 原创

114万+: 周排名

8万+: 总排名

4773: 访问

: 等级

198: 积分

64: 粉丝

78: 获赞

5: 评论

73: 收藏

私信

关注

热门文章

最新评论

计算机网络 HTTP协议
CSDN-Ada助手: 推荐网络技能树：https://edu.csdn.net/skill/network?utm_source=AI_act_network
Leveraging Large Language Models in Conversational Recommender Systems论文精读
CSDN-Ada助手: 恭喜您写了第8篇博客，“Leveraging Large Language Models in Conversational Recommender Systems论文精读”，内容丰富且有深度，对于推荐系统的研究有很大的启发作用。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。建议您在下一篇博客中可以尝试结合实际案例或者个人经验，以更直观生动的方式呈现研究成果，让读者更易于理解和吸收。期待您更多的精彩作品！
GPT系列论文核心
CSDN-Ada助手: 恭喜您撰写了第7篇博客，题为“GPT系列论文”。您的持续创作令人钦佩！看到您对GPT系列论文的关注和分享，我感到非常激动。在这个快速发展的领域中，对于这一系列论文的深入研究和解读，为我们提供了宝贵的见解。在下一步的创作中，我想提供一些建议。或许您可以考虑从一个更具体的角度深入探讨GPT系列论文中的某个具体主题，或者通过与其他相关领域的交叉研究，为读者提供更全面的视角。同时，您也可以考虑与其他研究者或实践者进行讨论，分享您的观点和发现，从而促进更深入的交流和合作。再次恭喜您的成就，并期待着您未来的创作。谦虚地说，我相信您的博客将继续为我们带来更多有趣且有价值的内容！
github命令
CSDN-Ada助手: 恭喜您写了这篇关于“github命令”的博客！您的持续创作真是令人钦佩。接下来，我建议您可以尝试分享一些关于github的高级技巧或者与其他工具的结合应用，这样能够让读者有更多的收获。期待您的下一篇作品！
目标检测总结
CSDN-Ada助手: 恭喜您写了第5篇博客！看了您的《目标检测总结》，我不禁感叹您对这个领域的深刻理解和总结能力。您对目标检测的解析和总结非常到位，让我受益匪浅。希望您能继续保持创作的热情，分享更多关于目标检测的知识和经验。我期待您能够在下一篇博客中深入探讨一些具体的目标检测算法或者实际应用案例，这样可以更好地帮助读者理解和应用。再次恭喜您，并期待您的下一篇作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。