RCNN、Fast RCNN、Faster RCNN的介绍与比较

最新推荐文章于 2024-07-22 09:26:29 发布

TBGBOSS

最新推荐文章于 2024-07-22 09:26:29 发布

阅读量717

点赞数 1

文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40278778/article/details/120267625

版权

该博客详细介绍了RCNN、Fast RCNN和Faster RCNN三种目标检测算法的工作原理及改进，包括候选框生成、特征提取、类别判断和位置调整。RCNN通过选择性搜索获取候选框，Fast RCNN通过共享特征图减少计算，Faster RCNN引入RPN网络实时生成候选框，显著提高了检测效率。

摘要由CSDN通过智能技术生成

一：RNN

RCNN使用以下四步实现目标检测：
1. 在图像中确定约1000-2000个候选框 (使用选择性搜索)
2. 每个候选框内图像块缩放至相同大小，并输入到CNN内进行特征提取
3. 对候选框中提取出的特征，使用分类器判别是否属于一个特定类
4. 对于属于某一特征的候选框，用回归器进一步调整其位置

一：合成规则：

一：颜色相近的（颜色直方图）

二：纹理相近的（梯度直方图）

三：合并后总面积小的（避免大面积区域陆续吞并小面积区域）

四：合并后，总面积在其BBOX占比小的（合并拼接面积大的区域、保证合并后的形状趋近方形）

二：提取特征

使用深度网络提取特征之前，首先把候选区域归一化成同一尺寸227×227。
此处有一些细节可做变化：外扩的尺寸大小，形变时是否保持原比例，对框外区域直接截取还是补灰。会轻微影响性能。

预训练采用Image Net 上的分类网络，根据需要微调全连接层

三：类别判断：

对每一类目标，使用一个线性SVM二类分类器进行判别。输入为深度网络输出的4096维特征，输出是否属于此类。
由于负样本很多，使用hard negative mining方法。
正样本：本类的真值标定框。
负样本：考察每一个候选框，如果和本类所有标定框的重叠都小于0.3，认定其为负样本

四：位置调整

目标检测问题的衡量标准是重

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。