目标检测常用网络RCNN系列快速回顾

最新推荐文章于 2022-10-13 10:32:05 发布

hr_net

最新推荐文章于 2022-10-13 10:32:05 发布

阅读量576

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38742161/article/details/88950034

版权

深度学习专栏收录该内容

46 篇文章

订阅专栏

本文介绍了目标检测中的RCNN系列算法，包括RCNN、Fast R-CNN及Faster R-CNN的发展历程与关键技术点。从候选区域的选择性搜索到区域提议网络（RPN），再到最终的特征提取与分类回归，详述了每一代算法的主要改进。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文对目标检测常用网络：RCNN系列做一个简单的小节

RCNN系列：

selective search：选择性搜索

我们不使用暴力方法，而是用候选区域方法（region proposal method）创建目标检测的感兴趣区域（ROI）。在选择性搜索（selective search，SS）中，我们首先将每个像素作为一组。然后，计算每一组的纹理，并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域，我们首先对较小的组进行分组。我们继续合并区域，直到所有区域都结合在一起。下图第一行展示了如何使区域增长，第二行中的蓝色矩形代表合并过程中所有可能的 ROI。

RCNN:SS+(resize)+每个ROI进行CNN+SVM/regression

Fast RCNN:SS+整体CNN+ROI pooling

ROI POOLING:

对选择搜索或者RPN网络提取的候选框，在CNN卷积得到的特征图上找到相应的映射区域，然后将映射区域提取出来进行max pooling，然后将得到的特征进行FC：

这里写图片描述

网络：

Faster RCNN: RPN+整体CNN+ROI

faster 与 fast流程图相同，以FPN代替SS，最后一层卷积层直接作为RPN

RPN：anchor

每个锚点预测三个尺度的上述三种不同宽高比的区域，共计9个。

最后总结一下各大算法的步骤：

RCNN

1.在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search)

2.每个候选框内图像块缩放至相同大小，并输入到CNN内进行特征提取

3.对候选框中提取出的特征，使用分类器判别是否属于一个特定类

4.对于属于某一类别的候选框，用回归器进一步调整其位置

Fast R-CNN

1.在图像中确定约1000-2000个候选框 (使用选择性搜索)

2.对整张图片输进CNN，得到feature map

3.找到每个候选框在feature map上的映射patch，将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层

4.对候选框中提取出的特征，使用分类器判别是否属于一个特定类

5.对于属于某一类别的候选框，用回归器进一步调整其位置

Faster R-CNN

1.对整张图片输进CNN，得到feature map

2.卷积特征输入到RPN，得到候选框的特征信息

3.对候选框中提取出的特征，使用分类器判别是否属于一个特定类

4.对于属于某一类别的候选框，用回归器进一步调整其位置

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。