CV计算机视觉(6)——目标检测及Faster-RCNN流程梳理


前言

上一篇博客把Faster-RCNN的关键技术说了一下,但是流程梳理那部分我觉得写得不妥当,所以单独写一篇梳理整个网络的工作流程再挖一下网络细节。

Faster-RCNN组成

以训练阶段为例,我把整个网络结构模块化为包括输入、数据预处理、backbone提取特征、RPN、Fast-RCNN、输出这五大部分。

1.输入样本并数据预处理

首先,假设样本图片IMAGE,尺寸大小Q×P,将其输入Faster-RCNN网络:
在这里插入图片描述

resize操作,处理图片的尺寸到H×W,适应模型要求:

在这里插入图片描述

2.backone提取特征

对图片做卷积操作提取特征,backbone以VGG16为例:
在这里插入图片描述

3.RPN生成候选框

分别经过两个1×1卷积组成的分类分支和回归分支,得到分类和回归特征图,通过特征映射得到region proposal后与真实标签计算LOSS学习参数。
在这里插入图片描述

得到初步的region proposa(黄色箭头),但是我们需要进行筛选,先通过与标签GT计算IOU阈值筛选掉得分低的(蓝色箭头),然后再进行NMS删除冗余的候选框(绿色箭头)
在这里插入图片描述

4.Fast-RCNN

对提取的候选框归一化尺寸,用ROI Pooling。然后送入模型训练
在这里插入图片描述

5.输出分类和回归pred

在这里插入图片描述
如果不想仅局限在2分类上,用[x,y,w,h,C]表示,C表示的是类别个数,具体问题就会有具体的值,比如如果是5分类,最后的向量形式为[x,y,w,h,class1,class2,class3,class4,class5]。

总结

在这里插入图片描述

补充:训练方式,分步训练

整个网络中一共有三个地方需要训练网络参数,一个是2backbone,一个是3RPN,一个是5Fast-RCNN中的backbo
在这里插入图片描述

用alternative traini的方式进行训练:
首先,2中的backbone直接使用imagenet上预训练的模型;
然后训练RPN的参数,其他两个网络不进行训练;
得到RPN的参数后训练fast-RCNN,其他两个网络同样不进行训练;
训练完fast-RCNN后可能效果不理想,基于这个参数再重训训练一次RPN;
再重新训练fast-RCNN。
大概就是这个训练步骤。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值