faster-rcnn-tf版网络流程详解

本文详细解析Faster R-CNN网络流程,基于VGG16,阐述RPN部分的结构与损失计算,包括RPN分类损失和回归损失。接着介绍ROIPooling操作,以及RCNN的分类和回归损失。最终,文章讨论了端到端训练方法,而未涉及交替训练策略。
摘要由CSDN通过智能技术生成

faster-rcnn论文连接:https://arxiv.org/pdf/1506.01497.pdf

代码地址:https://github.com/zacks417/faster-rcnn-tf

按照论文思路并参考了其他版本的源码,这版代码是我加过注释的tf版本,在我自己的电脑上能跑通。

本机实验环境:py3.6, CUDA9.0, tf1.7,GTX1070。

下面讲解一下faster-rcnn整体网络流程

以VGG16为backbone来讲解faster-rcnn整体流程

以vgg网络输入为**600x800x3**为例,网络的**conv5_3**为rpn网络的输入,就是上图中的feature Map, 大小为**1x38x50x512**

,backbone部分就不讲了,比较简单.

RPN部分:

下图为rpn的结构图,输入即为conv5_3,输出rois(128x84)128个感兴趣区域,84为21x4,即为每个类别都预测bbox。

conv5——3首先通过3x3 same卷积降维,记为rpn_conv,维度变成1x38x50x512,接下去是两个分支,都

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值