Rich feature hierarchies for accurate object detection and semantic segmentation(R-CNN,2013)论文笔记

Rich feature hierarchies for accurate object detection and semantic segmentation原文链接

一、解决问题

2012年,Krizhevsky等人在ImageNet大规模视觉识别挑战赛(ILSVRC)上的表现出色(AlexNet)。
那么ImageNet上的CNN分类结果在何种程度上能够应用到PASCAL VOC挑战的物体检测任务上?
本文主要解决两个问题:
1.在候选区域上自下而上使用大型(此时的大型仅仅只是指5层的网络)卷积神经网络(CNNs)用以定位物体。
2.当带标签的训练数据不足时,先针对辅助任务进行有监督预训练,再进行特定任务的调优,就可以产生明显的性能提升。

二、解决方法

(一)问题定位

一种方法将定位作为回归问题。然而,Szegedy等人与我们并行的工作表明这种策略在实践中可能不会很好(实际上也是可以的,比如后来的YOLO系列和SSD)。另一种方法是构建一个滑动窗口检测器。

(二)解决滑动窗与感受野的矛盾

文中用于提取特征的CNN有五层,这就要求有很大的感受野,进而要求滑动窗必须很大。这样必然会导致滑动窗对目标定位不精确的问题(大的滑动窗永远无法把小物体框的严丝合缝)。那么怎么办呢?最直接的办法就是把小的滑动窗放大,使其尺寸满足卷积网络的要求。而本

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值