R-FCN网络学习

R-FCN网络针对传统检测网络的效率问题,提出了几乎在整个图像上共享计算的方法,旨在平衡图像分类的平移不变性和目标检测的平移敏感性。该网络由全卷积子网络和RoI-wise子网络组成,解决RoI池化层在ResNets和GoogLeNets中引入的翻译不变性破坏,同时试图在不牺牲速度的情况下提高检测精度。
摘要由CSDN通过智能技术生成

由于传统的检测网络:apply a costly per-region subnetwork hundreds of times

R-FCN:almost all computation shared on the entire image.

解决问题:分类的平移不变性检测的平移敏感性。(a dilemma between translation-invariance in image classification and
translation-variance in object detection)

介绍

流行的检测网络一般是由RoI分割成两个子网络:(1)独立于RoIs的全卷积子网络(共享运算)

                                                                              (2)RoI-wise子网络(不共享运算)

历史问题:AlexNet  and VGG Nets 这种传统网络的spatial pooling layer is naturally turned into the RoI pooling layer在目标检测中。

最近的新网络:ResNets and GoogLeNets are by design fully convolutional. 在目标检测架构中,很自然的使用全部的卷积层来构建共享卷积子网络,让RoI-wise没有隐藏层。但是:降低了检测精度,不能与分类精度匹配。为了解决这个问题:ResNet paper里面提到Faster R-CNN的RoI pooling layer is unnaturally inserted between two sets of convolutional layers,breaks down translation invariance(the post-RoI convolutional layers are no longer translation-invariant when evaluated across different regions),提高了精度,但是由于unshared per-RoI computation牺牲了速度。since it introduces a considerable number of region-wise layers

each of the kxk bin aggregates responses from only one score map out of the bank of kxk score maps 。

 要实现平移敏感,引入了position-sensitive score maps,通过使用一堆 specialized convolutional layers。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
R-FCN(Region-based Fully Convolutional Networks)是一种用于目标检测的深度学习网络模型。它是基于全卷积网络(Fully Convolutional Networks)和区域建议网络(Region Proposal Networks)的结合。R-FCN 在目标检测任务上取得了较好的性能。 关于 R-FCN 的 Matlab 实现,你可以参考以下步骤: 1. 下载 R-FCN 的源代码。你可以在 GitHub 上找到一些开源实现,如 https://github.com/daijifeng001/R-FCN 或者其他类似的仓库。 2. 安装 Matlab 并配置深度学习框架。Matlab 支持多种深度学习框架,如 TensorFlow、PyTorch、Caffe 等。根据你选择的 R-FCN 实现,安装对应的深度学习框架并配置 Matlab 的环境。 3. 加载预训练模型。R-FCN 需要在大规模数据集上进行预训练,你需要下载相应的预训练模型,并将其加载到 Matlab 中。 4. 准备数据集。为了使用 R-FCN 进行目标检测,你需要准备一个目标检测数据集,包括图像和标注信息。确保数据集格式与 R-FCN 的输入要求相符。 5. 运行训练代码。根据你选择的 R-FCN 实现,运行相应的训练代码来训练网络模型。你可能需要调整一些训练参数,如学习率、批大小等。 6. 进行目标检测。训练完成后,你可以使用 R-FCN 进行目标检测。提供待检测图像作为输入,R-FCN 将输出目标类别和位置信息。 请注意,以上步骤仅提供了一般的指导,具体实现可能因不同的 R-FCN 实现而有所差异。在实际操作中,请参考相应的文档和代码示例,以确保正确实现 R-FCN 网络
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值