深度学习在目标检测中的应用及其tensorflowAPI实践(三)

这系列文章的内容目录如下:

  • 目标检测的任务

  • 深度学习在目标检测中的应用

    • RCNN
    • fast RCNN
    • faster RCNN
    • RFCN
    • yolo
    • yolo V2
    • SSD
  • tensorflow目标检测API的使用

第一篇里说完了RCNN和fast RCNN,第二篇里说了faster RCNN,这一篇来说RFCN。

如果看完了前面的两篇那么对深度学习在目标检测中的应用应该就已经有了一个还算不错的理解,很多概念也基本都有了,比如fast RCNN中提到的ROIpooling,faster RCNN中提出的RPN网络,anchors等。这些对理解RFCN都有很大的帮助。

faster RCNN把提取ROI和对ROI进行分类并且做bbox-rg都用深度学习的方式给解决了,检测精度在我写这篇文章的时候仍然是可以称得上是state-of-the-art的,但速度就不敢恭维了。不过在谷歌最近的一篇比较RFCN,faster RCNN和SSD的论文中指出(https://arxiv.org/abs/1611.10012),如果减少faster RCNN中RPN网络输出的bbox的个数,可以在精度损失有限的情况下,极大的提高faster RCNN的检测速度。

回到这篇的主角,开始说RFCN。
RFCN的全称是Region-based Fully Convolutional Networks,整个网络都是基于卷积的,没有全连接。RFCN中也有RPN网络,但相对faster RCNN,RFCN中的RPN和最后的softmax以及bbox-rg有了更多的共享计算,只在最后分开了,这样没有多余的计算,所以速度也有所提升。
RFCN的结构如下:
这里写图片描述
首先一张图片输入一个CNN,这里原文使用的是101层的resnet。经过CNN后会得到一系列的feature map,然后根据上图中上方的RPN网络得到ROI(RPN网络请参考上一篇faster RCNN中的叙述,会输出很多经过一次bbox-rg的ROI)。
得到ROI后再回到下面的路,这时比如说你得到的feature map为W*H*1024(对应上图中从左往右第二个白色的方块,下面标着feature maps的),用 k2(C+1)

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值