faster rcnn论文_目标检测点滴理解(1)-RCNN系列

To Be Continued..........................

本系列文章目的是分享并记录自己在目标检测领域的个人理解, 内容包括论文翻译个人分析。纯粹是为了个人学习,不具有参考意义

既然是为了入坑目标检测,那么faster-rcnn系列则是绕不过去的一个点。下面这段话是fasterrcnn论文中对检测任务本质的探讨。

The R-CNN method [5] trains CNNs end-to-end to classify the proposal regions into object categories or background. R-CNN mainly plays as a classifier, and it does not predict object bounds (except for refining by bounding box regression). Its accuracy depends on the performance of the region proposal module (see comparisons in [20]).

RCNN系列主要是训练一个端到端CNN网络对候选区域进行分类(背景或目标类型)。他其实可以看做一个分类器,因为他并没有去预测目标边界。检测精度取决于区域候选模块的表现。作者提出了一个叫做fasterrcnn的检测器,它包括两个模块,一个是用来提出候选区域的深度全卷积网络,另一个是使用提供的候选区域的fast-RCNN检测器。这个RPN其实就类似于attention一样,告诉网络应该朝哪看,哪里可能有object。

RPN输入是任意尺寸的图片,而输出则是一堆矩形框并带有object score.为了和detector部分共享计算,作者使用卷积网络去实现这个模块。为了产生候选区域,作者在feature map 上弄了一个滑动窗口, 每一个窗口映射到低维feature,这个feature然后fed到a box-regression layer (reg) and a box-classification layer (cls).

1e340f18b1d4d7cdbaceb5303610b0fa.png

上面这张图特别清晰的展示什么是anchors,在每个窗口的位置,同时预测多个候选区域k,回归层有4k输出(坐标),分类层有2k个probability scores. anchor位于窗口中心,与scale, aspect ratio有关。anchor另外一个重要的性质就是平移不变性,当图片发生旋转的时候,网络依然还能够预测位置。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值