各种目标检测网络

最新推荐文章于 2024-08-11 09:35:58 发布

tanfuz

最新推荐文章于 2024-08-11 09:35:58 发布

阅读量3.1k

点赞数 2

本文链接：https://blog.csdn.net/tanfuz/article/details/113732758

版权

R-CNN -2014 -two stage

在这里插入图片描述

候选区域生成：一张图像生成1K~2K个候选区域（采用Selective Search 方法）
特征提取：对每个候选区域，使用深度卷积网络提取特征（CNN）
类别判断：特征送入每一类的SVM 分类器，判别是否属于该类
位置精修：使用回归器精细修正候选框位置
缺点：
RoI（Region Proposal/Region of Interest）的获取太麻烦（选择性搜索Selective Search）且正确率感人。
RoI的特征提取太耗时（先切图片，然后CNN提特征，导致数据无法共享），且中间涉及大量的硬盘读写，数据要在硬盘，内存，现存三者之间来回倒腾。
Fast R-CNN把问题解决了一半（第二个问题），第一个问题还得看Faster RCNN。

在这里插入图片描述

R-CNN的主要性能瓶颈在于需要对每个提议区域独立抽取特征。，由于这些区域通常有大量重叠，独立的特征抽取会导致大量的重复计算。Fast R-CNN对R-CNN的一个主要改进在于只对整个图像做卷积神经网络的前向计算。
与R-CNN相比，Fast R-CNN用来提取特征的卷积神经网络的输入是整个图像，而不是各个提议区域。而且，由于用于提取特征得网络参数可以通过训练更新。
它的主要计算步骤如下。

提取特征：提取特征的卷积神经网络的输入是整个图像，而不是各个提议区域。
RoI与Roi pooling：兴趣区域池化（region of interest pooling，RoI池化）层，将卷积神经网络的输出和提议区域作为输入，输出连结后的各个提议区域抽取的特征
预测

在这里插入图片描述

引入anchor机制
在结构上，Faster RCNN已经将特征抽取(feature extraction)，proposal提取，bounding box regression(rect refine)，classification都整合在了一个网络中，使得综合性能有较大提高，在检测速度方面尤为明显。
4个内容：

Conv layers。作为一种CNN网络目标检测方法，Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。
Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative，再利用bounding box regression修正anchors获得精确的proposals。
Roi Pooling。该层收集输入的feature maps和proposals，综合这些信息后提取proposal feature maps，送入后续全连接层判定目标类别。
Classification。利用proposal feature maps计算proposal的类别，同时再次bounding box regression获得检测框最终的精确位置。

在这里插入图片描述

YOLO v1存在的问题：

在这里插入图片描述

Using multi-anchors for single ground truth：YOLO v3是1个anchor负责一个GT，YOLO v4中用多个anchor去负责一个GT，缓解了正负样本不均衡的问题。
Eliminate_grid sensitivity：解决anchor边界的位置是取不到的问题
CIoU-loss：

在这里插入图片描述
2.

3.

4.