RFBnet论文笔记

作者认为,当前二阶段网络获得较好的准确率,然而因为特征来源于更深层的网络的庞大计算成本,所以速度较慢;一阶段网络为了加速检测而没有使用目标候选区域过程,因而牺牲了准确率,对于获得了可以与顶尖的二阶段网络准确率媲美的DSSD和RetinaNet,它们的表现提升来源于限制了效率的极深网络ResNet-101。

因此提出,建立一个快且强力的检测器,应该对轻量级网络加上人为设计的部分而不是顽固地加深模型。另一方面,一些神经学研究表明在人类视觉皮质中,population Receptive Field(pRF)的规模在视网膜定位图中是随着离心率地增加而增加的。它有助于彰显靠近中心区域的重要性并提升小空间位移带来的不灵敏度(这一块不懂,图片如下)。而一些浅层的descriptor利用这一机制在matching image patches方面也取得了较好的效果。

作者给出图片说明,pRF规模随着离心率增加,并且不同图谱的pRF大小规模也不一样。key指视觉皮质中的区域。

B中的spatial array基于图A参数的设置。每个圆形的半径是合适离心率下的RF的大小。

作者受人类视觉系统RF结构的启发,提出了Receptive Field Block (RFB), 以加强轻量级CNN模型学习到的深层特征,以创造快而精准的检测器。特别地,RFB根据不同大小规模的RFs对应的不同大小的kernels采用多分支池化层,利用扩大卷积层以控制离心率,并reshape生成最终的特征表达(如下图)。随后在SSD顶层组装RFB模块,另外,RFB模块是通用的,对网络结构带来很少的限制。

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值