前言
1.本文重点是RFB模块(Receptive Field Block),尽量用较少篇幅表达清楚论文算法,其他一些不影响理解算法的东西不做赘述
2.博客主要是学习记录,为了更好理解和方便以后查看,当然如果能为别人提供帮助就更好了,如果有不对的地方请指正(论文中的链接是我经过大量搜索,个人认为讲解最清楚的参考)
创新点
1.结合人类视觉系统,提出RFB模块
2.将RFB模块用于SSD,提出RFB Net
问题引出
我们都知道一刀流比二刀流快,但是精度不如二刀流;目前一些使用强大主干网络(如ResNet-101)的一刀流精度已经可以媲美二刀流,但是,因为主干网络计算量太大,导致耗时增加,算法又变慢了;所以作者就想引入某些手工机制来增强轻量级网络的特征表示能力,而不是顽固地深化模型;作者结合人类视觉认知(一堆生物学知识,不知道说的啥,反正弄懂本文算法就行),提出Receptive Field Block
RFB模块
1.RFB 工作原理