R-CNN 简单梳理

最新推荐文章于 2022-11-10 18:42:26 发布

时光杂货店

最新推荐文章于 2022-11-10 18:42:26 发布

阅读量2.3k

点赞数 3

分类专栏：目标检测文章标签：深度学习 rcnn 神经网络目标检测

本文链接：https://blog.csdn.net/xg123321123/article/details/53048204

版权

目标检测专栏收录该内容

4 篇文章 1 订阅

订阅专栏

R-CNN通过Selective Search生成候选区域，利用预训练的CNN提取特征，并用SVM进行类别判断，再用回归器修正位置。它引入深度学习到目标检测，提升了性能，特别是在少量标注数据上通过迁移学习效果显著。

摘要由CSDN通过智能技术生成

R-CNN 简单梳理

作者：xg123321123

出处：http://blog.csdn.net/xg123321123/article/details/53048204

1 亮点

R-CNN将卷积神经网络应用到了自底向上的目标定位；
以往的目标检测算法使用滑窗法（传统的SIFT，HOG等方法）依次判断所有可能的区域；而R-CNN是预先提取一系列较可能是物体的候选区域，之后只在这些候选区域上提取特征，进行判断；
发现当标注数据比较少时，通过先在有监督的数据集上训练，然后到特定任务的数据集上fine-tuning的方法，可以得到较好的新能：也就是说使用Imagenet上训练好的模型，在需要训练的数据上fine-tuning，提升的效果显著。

2 大致流程

一张图像生成1K~2K个候选区域（Regions）；
对每个候选区域，使用深度网络（CNN）提取特征；
特征送入每一类的SVM 分类器，判别是否属于该类；
使用回归器精细修正候选框位置。

3 候选区域生成

使用Selective Search方法从一张图像生成约2000-3000个候选区域。

Selective Search方法先基于各种颜色特征将图像划分为多个小块，然后自底向上地对不同的块进行合并，在这个过程中，合并前后的每一个块都对应于一个候选窗口，最后挑出最有可能包含待检测目标的窗口作为候选窗口。

具体流程

使用过分割手段，将图像分割成小区域;
查看现有小区域，合并可能性最高的两个区域,重复直到整张图像合并成一个区域为止；
输出所有曾经存在过的区域，所谓候选区域；

合并规则

优先合并以下四种区域：

颜色（颜色直方图）相近的；
纹理（梯度直方图）相近的；
合并后总面积小的；
- 保证合并操作的尺度较为均匀，避免一个大区域陆续“吃掉”其他小区域；
- 假设有区域a-b-c-d-e-f-g-h。较好的合并方式是：ab-cd-ef-gh -> abcd-efgh -> abcdefgh；不好的合并方法是：ab-c-d-e-f-g-h ->abcd-e-f-g-h ->abcdef-gh -> abcdefgh。
合并后总面积在其Bounding box中所占比例大的。
- 用于保证合并后形状规则。例：左图适于合并，右图不适于合并。

上述四条规则只涉及区域的颜色直方图、纹理直方图、面积和位置。合并后的区域特征可以直接由子区域特征计算而来，速度较快。

为尽可能不遗漏候选区域，上述操作在多个颜色空间中同时进行（RGB,HSV,Lab等）。在一个颜色空间中，使用上述四条规则的不同组合进行合并。所有颜色空间与所有规则的全部结果，在去除重复后，都作为候选区域输出。

Selective Search的源码在这里。

候选区域生成和后续步骤相对独立，实际可以使用任意算法进行。