理解目标检测算法之Light Head R-CNN


对于目标检测任务,输入图像通常都要经历3个步骤,Backbone + Head + Postprocess(NMS),目标检测算法的优化,通常也是围绕着这3个方面展开的。针对Backbone的优化有DetNet,针对Head的优化有Light head R-CNN,针对Postprocess的优化有soft nms和softer nms。值得一提的是,除了soft nms,其余的几篇文章都是face ++出品,不愧是多届coco目标检测竞赛的冠军,确实厉害。本文接下来将只介绍Light head R-CNN,大家如果对其它文章感兴趣,也可以直接去读原文,一定会对目标检测任务有更多的感悟。

1 动机

对于two-stage的目标检测算法,常见的有Faster R-CNN和R-FCN。当图像中的proposals个数增加时,Faster R-CNN的计算量会迅速增加,R-FCN虽然解决了Faster R-CNN中存在的重复计算问题,但是backbone最终的特征图channels较大,导致计算量也比较大。

Light Head R-CNN是Faster R-CNN和R-FCN的结合体,主要的改进点包括2点,(1)per-Roi RCNN subnetwork计算量尽可能多地共享;(2)整个目标检测网络的head部分channels个数减少。

2 网络结构

网络结构如下图,同R-FCN相比,它有两个不同的地方,(1)使用large

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值