Receptive Field Block Net for Accurate and Fast Object Detection论文阅读

论文阅读:Receptive Field Block Net for Accurate and Fast Object Detection

论文下载地址:https://eccv2018.org/openaccess/content_ECCV_2018/papers/Songtao_Liu_Receptive_Field_Block_ECCV_2018_paper.pdf

论文代码:https://github.com/ruinmessi/RFBNet

 

论文摘要:

当前目标检测效果很好的算法都使用了很深的网络结构(例如残差网络等),虽然这些算法可以取得很好的计算效果但是它们的计算量十分的巨大。虽然有一些轻量级的目标检测的网络结构但是他的准确率和鲁棒性相对较差。作者引入了生物中人类视觉的感受野概念建立了一个感受野块的网络结构,将偏心率和感受野大小关联起来。用来增强这些轻网络结构的准确率和鲁棒性。

论文创新:

1.提出了感受野块,来模拟人类视觉中感受野和偏心率之间的关系。

2.将感受块嵌入到SSD框架中,在维持计算量的情况下来提高精度和鲁棒性。

3.修改之后的网络才COCO和VOC里面去得了很好的效果。

相关工作:

只要介绍了两步检测,一步检测和感受野的定义概念。

偏心率和感受野之间的关系:(在生物学和神经学中的结果)

A图表示1.随着偏心率的增加,感受野也会不断的增加。2.不同的特征图上感受野是不一样的。

B图是A 图的空间阵列。

网络结构:

上图就是一个本文中的一个感受野块。通过1*1,3*3,5*5使用不同的卷积核来模拟人类视觉中的不同的感受野结构(RFs)。rate=1,3,5来模拟人类视觉中不同的偏心率对感受野的影响。

上图是感受野块的两个网络结构,右边的网络通过使用3*3的卷积来代替5*5卷积来减少网络的计算量。(具体的还是要看代码中的网络结构。)

SSD网络结构:

上图中灰色的使用的是VGG-16的网络结构。黄色的区域就是感受野块网络结构。将感受野嵌入到网络中取得了很好的效果。

这是她实验的一个效果图。效果提升很明显。

下图是SSD框架下mobilenet基础上增加的感受野块效果提升了1.4%,参数增加了0.6M。效果还是很明显的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值