CV计算机视觉（6）——目标检测及Faster-RCNN流程梳理

最新推荐文章于 2024-02-06 00:34:54 发布

schedule list

最新推荐文章于 2024-02-06 00:34:54 发布

阅读量282

点赞数

分类专栏： 14周AI人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41761357/article/details/112607525

版权

14周AI人工智能专栏收录该内容

33 篇文章 13 订阅

订阅专栏

文章目录

前言
Faster-RCNN组成
总结
补充：训练方式，分步训练

前言

上一篇博客把Faster-RCNN的关键技术说了一下，但是流程梳理那部分我觉得写得不妥当，所以单独写一篇梳理整个网络的工作流程再挖一下网络细节。

Faster-RCNN组成

以训练阶段为例，我把整个网络结构模块化为包括输入、数据预处理、backbone提取特征、RPN、Fast-RCNN、输出这五大部分。

1.输入样本并数据预处理

首先，假设样本图片IMAGE，尺寸大小Q×P，将其输入Faster-RCNN网络：
在这里插入图片描述

resize操作，处理图片的尺寸到H×W，适应模型要求：

在这里插入图片描述

2.backone提取特征

对图片做卷积操作提取特征，backbone以VGG16为例：
在这里插入图片描述

3.RPN生成候选框

分别经过两个1×1卷积组成的分类分支和回归分支，得到分类和回归特征图，通过特征映射得到region proposal后与真实标签计算LOSS学习参数。
在这里插入图片描述

得到初步的region proposa（黄色箭头），但是我们需要进行筛选，先通过与标签GT计算IOU阈值筛选掉得分低的（蓝色箭头），然后再进行NMS删除冗余的候选框（绿色箭头）
在这里插入图片描述

4.Fast-RCNN

对提取的候选框归一化尺寸，用ROI Pooling。然后送入模型训练
在这里插入图片描述

5.输出分类和回归pred

在这里插入图片描述
如果不想仅局限在2分类上，用[x,y,w,h,C]表示，C表示的是类别个数，具体问题就会有具体的值，比如如果是5分类，最后的向量形式为[x,y,w,h,class1,class2,class3,class4,class5]。

总结

在这里插入图片描述

补充：训练方式，分步训练

整个网络中一共有三个地方需要训练网络参数，一个是2backbone，一个是3RPN，一个是5Fast-RCNN中的backbo
在这里插入图片描述

用alternative traini的方式进行训练：
首先，2中的backbone直接使用imagenet上预训练的模型；
然后训练RPN的参数，其他两个网络不进行训练；
得到RPN的参数后训练fast-RCNN，其他两个网络同样不进行训练；
训练完fast-RCNN后可能效果不理想，基于这个参数再重训训练一次RPN;
再重新训练fast-RCNN。
大概就是这个训练步骤。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CV计算机视觉（6）——目标检测及Faster-RCNN流程梳理

文章目录前言Faster-RCNN组成1.输入样本并数据预处理2.backone提取特征3.RPN生成候选框4.Fast-RCNN5.输出分类和回归pred总结前言上一篇博客把Faster-RCNN的关键技术说了一下，但是流程梳理那部分我觉得写得不妥当，所以单独写一篇梳理整个网络的工作流程再挖一下网络细节。Faster-RCNN组成以训练阶段为例，我把整个网络结构模块化为包括输入、数据预处理、backbone提取特征、RPN、Fast-RCNN、输出这五大部分。1.输入样本并数据预处理首先，假
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。