Faster R-CNN：端到端的目标检测网络

新缸中之脑

于 2024-06-03 08:46:27 发布

阅读量1.8k

点赞数 31

文章标签： r语言 cnn 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shebao3333/article/details/139402118

版权

本文回顾了由微软研究人员开发的 Faster R-CNN 模型。Faster R-CNN 是一种用于物体检测的深度卷积网络，在用户看来，它是一个单一的、端到端的统一网络。该网络可以准确快速地预测不同物体的位置。为了真正理解 Faster R-CNN，我们还必须快速概述一下它所进化的网络，即 R-CNN 和 Fast R-CNN。

本文首先快速回顾了基于区域的 CNN (R-CNN)，这是首次尝试构建使用预训练 CNN 提取特征的物体检测模型。接下来，快速回顾了 Fast R-CNN，它比 R-CNN 更快，但不幸的是它忽略了区域提案的生成方式。Faster R-CNN 后来解决了这个问题，它构建了一个区域提案网络，可以生成区域提案，并将其输入到检测模型 (Fast R-CNN) 以检查物体。

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割

1、对象检测流程概述

传统的对象检测技术遵循下图给出的 3 个主要步骤。第一步涉及生成多个区域提案。这些区域提案是可能包含对象的候选区域。这些区域的数量通常为几千个，例如 2,000 个或更多。一些生成区域提案的算法的示例是选择性搜索和 EdgeBox。

从每个区域提案中，使用各种图像描述符（例如方向梯度直方图 (HOG)）提取固定长度的特征向量。该特征向量对于对象检测器的成功至关重要。即使对象由于某些变换（例如缩放或平移）而发生变化，该向量也应该充分描述对象。

然后使用特征向量将每个区域提案分配给背景类或对象类之一。随着类别数量的增加，构建可以区分所有这些对象的模型的复杂性也会增加。用于对区域提案进行分类的流行模型之一是支持向量机 (SVM)。

这个快速概述足以理解基于区域的卷积神经网络 (R-CNN) 的基础知识。

2、R-CNN 快速概览

2014 年，加州大学伯克利分校的一组研究人员开发了一种名为 R-CNN（基于区域的卷积神经网络的缩写）的深度卷积网络，它可以检测图像中的 80 种不同类型的物体。

与上图所示的物体检测技术的通用流程相比，R-CNN 的主要贡献只是基于卷积神经网络 (CNN) 提取特征。除此之外，一切都与通用物体检测流程相似。下图显示了 R-CNN 模型的工作原理。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。