论文笔记——Rich feature hierarchies for accurate object detection and semantic segmentation

 

最近在看一些目标检测的论文,本文是经典的R-CNNRegions with CNN features),随之产生的一系列目标检测算法:RCNN,Fast RCNNFaster RCNN代表当下目标检测的前沿水平。在此之前主要是SIFT和HOG特征。

Code:https://github.com/rbgirshick/rcnn

概述

 

测试流程:(1)输入测试图像

  2)利用selective search算法在输入图像中提取大约2000region proposals

  3)将每个region proposal warp(缩放)227*227,再输入到CNN计算特征(fc7的输出),提取出的特征向量的维度为4096

  4)将提取到的特征输入到SVMs中分类。

  5)对分类好的region proposalbounding-box regreesion每个region都会给出所对应的score,选出前几个对大数值,然后再用非极大值抑制canny来进行边缘检测,最后就会得到所对应的bounding-box

针对的问题:localizing objects with a deep network 和 training a high-capacity model with only a small quantity of annotated detection data. 

(1)图像中的目标定位两种思路:把定位当做回归问题或利用滑动窗口(sliding-window)

(2)对于数据量不足(labeled data is scarce):在大数据集(ImageNet)上进行预训练,之后在特定领域的数据集(PASCAL)上对网络进行fine-tuning(微调)。

非极大值抑制NMS)先计算出每一个bounding box的面积,然后根据score进行排序,把score最大的bounding box作为选定的框,计算其余bounding box与当前最大score与box的IoU,去除IoU大于设定的阈值的bounding box

运行时间分析:——快的原因:CNN的参数共享,低维度的features vectors,所需要的内存小

数据集的划分:若region proposal与ground-truth的IoU大于某个阀值则为正样本,否则为负样本。阀值是由a grid search over{0,0.1,...,0.5}on a validation set产生的。

结果:PASCAL VOC上的检测率35.1%提升到53.7%。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值