目标检测之R-CNN

最新推荐文章于 2023-03-13 17:42:58 发布

thisiszdy

最新推荐文章于 2023-03-13 17:42:58 发布

阅读量244

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/thisiszdy/article/details/88734739

版权

目标检测专栏收录该内容

23 篇文章 3 订阅

订阅专栏

一、目标检测之R-CNN

Rich feature hierarchies for accurate object detection and semantic segmentation(用于精确物体定位和语义分割的丰富特征层次结构)
论文链接：http://arxiv.org/abs/1311.2524
论文翻译：https://blog.csdn.net/xiaqunfeng123/article/details/78715983
论文详解：https://blog.csdn.net/u014696921/article/details/52824097

二、R-CNN算法

在这里插入图片描述
1、候选区域选择(region proposal)：用来给输入的图像生成大约2000个类别无关的候选区域；R-CNN采用的区域选择方法是选择性搜索(selective search)。

2、特征提取：用来从每个候选区域中提取固定长度为4096的特征向量。R-CNN利用卷积网络(比如AlexNet)来计算每个候选区域的特征，要求先把推荐转变为卷积网络的输入大小(比如227×227的RGB图像)，并做减均值处理。

3、区域分类：1）用来对每个候选区域进行打分和筛选；R-CNN采用支持向量机(SVM)对所提取的特征向量打分，在根据分值高低，通过贪婪非最大抑制(NMS)进行筛选，保留高分推荐，拒绝低分推荐，拒绝条件是与某高分推荐的交并比(IOU)大于一个通过学习得到的阈值。2）通过边界回归（bounding-box regression) 得到精确的目标区域，由于实际目标会产生多个子区域，旨在对完成分类的前景目标进行精确的定位与合并，避免多个检出。

R-CNN存在的问题：

1）多个候选区域对应的图像需要预先提取，占用较大的磁盘空间；

2）针对传统CNN需要固定尺寸的输入图像，crop/warp（归一化）产生物体截断或拉伸，会导致输入CNN的信息丢失；

3）每一个ProposalRegion都需要进入CNN网络计算，上千个Region存在大量的范围重叠，重复的特征提取带来巨大的计算浪费。