目标检测算法:FasterRCNN

Faster R-CNN是目标检测的重要里程碑,它首次实现了目标检测的端到端深度学习模型。该框架采用两阶段方法,通过RPN网络高效生成候选区域,再进行分类和框精调,优化了RCNN系列的效率。理解Faster R-CNN有助于掌握两阶段目标检测的基本流程。
摘要由CSDN通过智能技术生成

目标检测任务是计算机视觉领域最基础的任务之一,目前深度学习方法已经在该领域全面领先于其他技术方案。目标检测任务需要对图像中的物体进行检测,输出有两个,框的位置,以及框的类别,这里目标的个数和类别数都可能有多个,这里的框是平行于图像宽和高的矩形框。从某种意义上讲,基于深度学习的目标检测框架也可以认为是以回归与分类为目标的多任务学习框架。

FasterRCNN是首个将图像的目标检测任务使用端到端的深度学习模型实现的框架。继承了RCNN和FastRCNN的技术路线,这一套算法是一脉相承的。FasterRCNN在FastRCNN的基础上,打通了全部使用神经网络的最后一步,即提出了RPN网络批量高效的生成区域建议框,这也是这篇文章最重要的创新点。这里介绍FasterRCNN这篇开山之作,笔者认为,只要读透这一个框架,就足够掌握两阶段目标检测任务的基本脉络。

FasterRCNN使用两阶段方式实现,这里所说的阶段,指的是一次边框估计的过程,每个阶段输出的内容都有两个,边框及其对应类别,分别是回归和分类任务。但是,这两个阶段是存在差异的,第一阶段使用RPN网络对暴力穷举出来的规则的框(作者用Anchor这个单词来表达这些框,下面也用这个单词进行介绍)进行初步分类筛选,因此这是一个针对每个框的二分类任务,标记每个框中有无物体,对于被认为存在物体的边框,会给出这些Anchor与真值之间的偏差量;第一阶段获得了一些可能存在物体的框,第二阶段的任务就是将这些框进行分类预测,并且输出与第一阶段格式相同的偏差量,对第一阶段得到结果做进一步的修正。




参考资料:
目标检测算法FasterRCNN简介与pytorch实现:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值