深度学习在目标检测中的应用及其tensorflowAPI实践（三）

最新推荐文章于 2024-08-03 16:03:27 发布

追梦飞阳

最新推荐文章于 2024-08-03 16:03:27 发布

阅读量3.1k

点赞数 4

分类专栏：深度学习目标检测文章标签：深度学习 RFCN 目标检测卷积神经网络机器学习

本文链接：https://blog.csdn.net/luoyang224/article/details/78110677

版权

本文是深度学习目标检测系列的第三篇，重点讲解RFCN（Region-based Fully Convolutional Networks）。RFCN采用全卷积网络，减少了额外计算，提升了检测速度。文章介绍了RFCN的结构、ROI处理方式以及与faster RCNN的比较，并概述了训练过程。

摘要由CSDN通过智能技术生成

这系列文章的内容目录如下：

目标检测的任务
深度学习在目标检测中的应用
- RCNN
- fast RCNN
- faster RCNN
- RFCN
- yolo
- yolo V2
- SSD
tensorflow目标检测API的使用

在第一篇里说完了RCNN和fast RCNN，第二篇里说了faster RCNN，这一篇来说RFCN。

如果看完了前面的两篇那么对深度学习在目标检测中的应用应该就已经有了一个还算不错的理解，很多概念也基本都有了，比如fast RCNN中提到的ROIpooling，faster RCNN中提出的RPN网络，anchors等。这些对理解RFCN都有很大的帮助。

faster RCNN把提取ROI和对ROI进行分类并且做bbox-rg都用深度学习的方式给解决了，检测精度在我写这篇文章的时候仍然是可以称得上是state-of-the-art的，但速度就不敢恭维了。不过在谷歌最近的一篇比较RFCN，faster RCNN和SSD的论文中指出（https://arxiv.org/abs/1611.10012），如果减少faster RCNN中RPN网络输出的bbox的个数，可以在精度损失有限的情况下，极大的提高faster RCNN的检测速度。

回到这篇的主角，开始说RFCN。
RFCN的全称是Region-based Fully Convolutional Networks，整个网络都是基于卷积的，没有全连接。RFCN中也有RPN网络，但相对faster RCNN，RFCN中的RPN和最后的softmax以及bbox-rg有了更多的共享计算，只在最后分开了，这样没有多余的计算，所以速度也有所提升。
RFCN的结构如下：
这里写图片描述
首先一张图片输入一个CNN，这里原文使用的是101层的resnet。经过CNN后会得到一系列的feature map，然后根据上图中上方的RPN网络得到ROI（RPN网络请参考上一篇faster RCNN中的叙述，会输出很多经过一次bbox-rg的ROI）。
得到ROI后再回到下面的路，这时比如说你得到的feature map为W*H*1024（对应上图中从左往右第二个白色的方块，下面标着feature maps的），用 k2(C+1)

最低0.47元/天解锁文章

追梦飞阳

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
深度学习在目标检测中的应用及其tensorflowAPI实践（三）

这系列文章的内容目录如下：目标检测的任务深度学习在目标检测中的应用RCNNfast RCNNfaster RCNNRFCNyoloyolo V2SSDtensorflow目标检测API的使用在第一篇里说完了RCNN和fast RCNN，第二篇里说了faster RCNN，这一篇来说RFCN。如果看完了前面的两篇那么对深度学习在目标检测中的应用应该就已经有了一个还算不错的理解，很多
复制链接

扫一扫

专栏目录