【目标检测】R-CNN（2014）

最新推荐文章于 2024-05-29 22:01:54 发布

zzl_1998

最新推荐文章于 2024-05-29 22:01:54 发布

阅读量173

点赞数

分类专栏：目标检测

本文链接：https://blog.csdn.net/qq_40731332/article/details/107179669

版权

15 篇文章 3 订阅

订阅专栏

R-CNN，Fast R-CNN，Faster R-CNN中的开篇之作。two-stage，第一步是选出候选区域，第二步是从候选区域中选出目标并分类。

region proposal：候选区域。

positive / negative excample: 正负样本，即前景 / 背景

bbox: bounding box

1. 对于每张图片，使用选择性搜索（Selective Search）选出候选区域。

最终，每张图片得到具有多个层次的候选框，大概2k个。

2. 对每个候选区域进行预处理：context padding（原图向周围扩展16个像素）和wrap（无视大小和比例，强制转换），最终变化为227*227的固定尺寸。然后输入到AlextNet提取4096维特征。

3. 使用SVM对特征进行分类，并得到相应分数。最终，对每个类使用非极大值抑制得到结果。对每种类别，训练回归函数，微调坐标。

非极大值抑制：

# 训练细节：

在ILSVRC2012 classification 上预训练CNN
为了让CNN更好的适应检测任务和变形候选窗口（warped proposal windows）。将AlextNet在ImageNet中的分类层替换，使用SGD和warped region proposals来微调（迁移学习）。
在fine-tuning中：1. 与ground-truth计算IoU >= 0.5的region proposal视作该类的positive。2. 其余视作negative。在每次SGD的迭代中，选择32个positive windows和96个background windows建立一个mini-batch。
在SVM中：1. ground-truth boxes视作对应类的positive example。2. 将与某类任何ground-truth的overlap都小于0.3的proposal视为该类的negative example。3. 其余的忽略。
SVM中处于灰色区域的hard negative excample对参数收敛更有意义。

关注