[论文阅读]R-FCN: Object Detection via Region-based Fully Convolutional Networks

最新推荐文章于 2020-04-29 21:56:04 发布

沅晨

最新推荐文章于 2020-04-29 21:56:04 发布

阅读量1.5w

点赞数

分类专栏：论文阅读文章标签：深度学习目标检测计算机视觉

本文链接：https://blog.csdn.net/u012361214/article/details/51507590

版权

R-FCN是MSRA提出的一种目标检测新方法，旨在通过去除最后的全连接层提升检测速度。该文总结了RCNN和Fast RCNN，并在Pascal VOC上取得了速度和性能的最佳平衡，使用了Residual Network。文章指出，通过位置敏感的特征映射，避免了 subnet 的重复计算，提高了效率。尽管在ResNet上的表现优于Faster RCNN，但缺乏与其他网络的比较，有待进一步验证。

摘要由CSDN通过智能技术生成

arxiv上的一篇新论文，出自MSRA，目前还没有发表，今天刚读完，文章的缺点还要想一想，有空更新。原文链接：点击打开链接

本文是基于region based framework的一种新的detection方法，主要目的是通过移除最后的fc层进行加速。同时通过本篇论文，很好的将RCNN，fast rcnn进行了一个general的总结。本文目前是Pascal voc上面速度和performance结合的最好的方法，并且用到了最新的residual network（好吧，也过去好久了其实）。唯一美中不足的是，没有其他网络，比如VGG16和GoogleNet的baseline，所以和不少其他的方法没有比较。

本文的motivation非常直接，首先，region base detection framework有一个问题，就是多多少少会有subnet的重复计算。回忆最早的RCNN，每一个proposal都会独立经历一次CNN网络抽取feature，那么这个时候，这个subnet就是整个网络，非常非常慢。后来的fast rcnn，先把整张image进行卷积计算，然后在最后一层通过ROI pooling把每一个proposal变成一个大小一致的map，对于每一个map，经过若干次fc层然后得到结果，在这个时候，这个subnet指的就是那若干层fc层。假如一幅图片的proposal有N个，所以这样经历subnet的计算也会有N次，subnet越深计算的效率越低。本文的想法就是不用这些sub