Light-Head R-CNN算法笔记

Light-Head R-CNN是针对Faster R-CNN和R-FCN的加速优化,通过简化ROI预测框过程,减少了计算复杂性和存储需求。该算法将网络分为body和light head两部分,body负责生成region proposal,light head进行高效预测。实验证明,Light-Head R-CNN在速度和准确率上优于其他算法,尤其是通过thin feature map和large separable convolution的设计,有效平衡了速度和精度。
摘要由CSDN通过智能技术生成

论文:Light-Head R-CNN: In Defense of Two-Stage Object Detector
链接:https://arxiv.org/abs/1711.07264
代码链接:https://github.com/zengarden/light_head_rcnn

这篇旷视的文章主要是对Faster RCNN、R-FCN算法做加速,取名为Light-Head RCNN,是因为作者将two stage的object detection算法的网络结构分成两部分,一部分是region proposal(或者叫ROI)的生成过程(文章中命名为body部分),另一部分是基于ROI预测框的过程(文章中命名为head部分)。对于像Faster RCNN、R-FCN这样的two stage的object detection算法,第二部分有一些操作耗时且存储量较大,因此称为heavy head。而本文的light head RCNN则是通过对第二部分的修改减少了许多复杂操作,所以称之为light head。

先来感受下Light-Head RCNN算法和其他算法相比的提升情况。Figure1是Light-Head RCNN算法和其他object detection算法在速度和准确率上的直观对比,可以看出在这两方面的优势还是很明显的。

这里写图片描述

Light-Head RCNN的主网络主要采用ResNet101(文中用”L“表示)或Xception(文中用“S”表示),前者的精度较高(比目前two stage的算法要高),后者的速度较快(比目前one stage的算法要快),可以看最后的实验分析。

Figure2介绍的是Faster RCNN、R-FCN和本文的Light-Head RCNN在结构上的对比。在Figure2中的三个网络,大体上都可以分成两大部分:RCNN subnet和ROI warping,其实严格讲还有一部分是分类网络提取特征,而这三个部分之间的关系大概是这样的:ROI warping以分类网络提取到的特征为基础来生成尺寸固定的ROI,而RCNN subnet则是以分类网络提取到的特征和ROI warping生成的ROI为输入来做分类和回归的。因此Figure2中三个网络结构中的虚线框部分的输入除了箭头所示的用分类网络提取的feature map外,还包括RPN网络生成的ROI

Faster RCNN如Figure2A所示,先用分类网络(原论文中是用VGG

评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值