目标检测基本网络理解

最新推荐文章于 2022-05-01 23:17:11 发布

good good study

最新推荐文章于 2022-05-01 23:17:11 发布

阅读量573

点赞数 1

分类专栏：深度学习目标检测文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_39454351/article/details/104825587

版权

9 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

目标检测基本网络

RCNN整体框架
流程分析图

一张图片通过SS产生1000到2000个候选区域，然后将每个候选区域（Region Proposal）缩放到同一尺寸，输入到CNN网络，然后使用提取的图像特征训练SVM和Bounding Box。

训练过程
预训练CNN：
正样本：Region Proposals 与 GT IOU大于0.5 20个类。
负样本：Region Proposals 与 GT IOU小于0.2 1个背景类。
CNN+Softmax 21 分类，进行预训练，然后去掉Softmax层，使用前面层提取特征。
训练SVM：
举例1个SVM进行训练。
正样本：GT区域提取的特征。
负样本：与GT IOU小于0.3提取的特征。
二分类进行训练。
Bounding Box训练：
某一个类的回归训练。
用IOU大于0.6的候选区域提取的特征，对4个边界框偏移量进行回归。
测试过程
SS选择1000到2000个Region Proposals。
尺寸统一到同样大小（后面有全连接层）。
利用CNN提取特征。
某一个Region Proposal提取的特征输入到20个SVM，哪个分类器的分数高，用来确定类别。
计算好所有Region Proposals的label后，使用NMS操作，获得没有冗余的子集。
将剩下区域的特征输入到Bounding Box模型。
根据SVM打标签，BB画框。

在这里插入图片描述
整体流程

在这里插入图片描述
训练RPN

正样本：与GT IOU大于0.7
负样本：与GT IOU小于0.3
损失函数：

训练Fast RCNN

RPN产生将近20000（40x60x9x）个anchors。
按照每个框的positive score从大到小排序，选择前eg 6000个。
限定超出图像边界的positive anchors。
删除较小的positive anchors。
对剩下的anchors进行NMS操作，产生将近2000个ROIs。
正样本：ROIs与GT IOU大于0.5。
负样本：与GT IOU 等于0。
损失函数和RPN损失一样，分类损失从2分类变成21分类。

Faster RCNN讲的很仔细的文章：一文读懂Faster RCNN.

关注