YoloV1-V3

最新推荐文章于 2024-06-17 22:03:01 发布

我就是超级帅

最新推荐文章于 2024-06-17 22:03:01 发布

阅读量268

点赞数

分类专栏：目标识别与检测 Yolo

本文链接：https://blog.csdn.net/weixin_35848967/article/details/108715198

版权

目标识别与检测同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

Yolo

1 篇文章 0 订阅

订阅专栏

1 YoloV1

1.1 论文思想

在这里插入图片描述

1.2 网络结构

在这里插入图片描述

1.3 损失函数

在这里插入图片描述

通过开根号设计可以使得，小的bbox loss有较大权重，大的bbox有较小的权重。

1.4 缺点

在这里插入图片描述
（1）在一群小的目标聚集在一起的时候，网络的识别效果就非常的差。
（2）当目标出现新的尺寸或者配置的时候，网络的预测的效果非常差。
（3）主要的错误原因就是定位的不准确，因为是直接预测目标的坐标信息，而不是像fater-rcnn和ssd预测微参数。

2 YoloV2

2.1 性能

在这里插入图片描述

根据上图可以看出yoloV2最高的检测精度可以达到78.6（YOLOv2 544544）,FPS最好可以达到67（YOLOv2 416416）

2.2 yoloV2比yoloV1上所作的尝试

1 Batch Normalization
在这里插入图片描述
2 High Resolution Classifier (更高分辨率的分类器)

传统的图像大小为224224的，这里作者采用448448的图像，做fine tune时结果可以提高4%mAP。
3 Convoltional With Anchor Boxes

在没有使用了Anchor时，精度为69.5mAP，召回率为81%，在使用了Anchor时，精度为69.2mAP，精度为88%，召回率的提高7个点。
4 Dimension Clusters
在这里插入图片描述
采用k-means聚类的方法获得Anchor的数量
5 Direct location prediction

6 Fine-Grained Features

7 Multi-Scale Training

每10个epoch之后改变网络的输入，输入的大小为32的倍数，{320,352,…,608}，最大的尺寸为608。

2.3模型框架

在这里插入图片描述

2.4 模型训练

在这里插入图片描述

2.5 缺点

在预测小目标的时候，效果任然不好。

3 YOLOv3

3.1 性能

在这里插入图片描述

横坐标是网络的推理时间。

3.2 网络结构

在这里插入图片描述
Darknet-53中没有池化层，这里用卷积层代替了池化层，每个模块后使用Convolution之后，size变为原来的1/2。（个人理解是，因为这里使用的conv代替的pooling，因而使得网络的检测速度变化）。因为网络的的参数比ResNet-152少，所以检测速度快。
当Convolutional中有BN时，Conv2d就不需要添加bias。
在这里插入图片描述

3.3 数据的处理

目标边界框的预测
在这里插入图片描述

正负样本的匹配
一张图片中有几个正样本就有几个ground truth的目标。
在这里插入图片描述
分配的原则
（1）与ground truth重合度最大的目标设置为正样本，当重合度大于某个阈值但是不是最大的重合度的时候，则将该样本忽略，并且将其他的bounding box设置为负样本。
（2）如果一个bounding box prior没有指定ground truth，则该样本即没有 loss for coordinate也没有class predictions loss，只有objectness。

3.4 损失的计算

在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/20200921180158221.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zNTg0ODk2Nw==,size_16,color_FFFFFF,t_70#pic_center

在这里插入图片描述

我就是超级帅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
YoloV1-V3

1 YoloV11.1 论文思想1.2 网络结构1.3 损失函数通过开根号设计可以使得，小的bbox loss有较大权重，大的bbox有较小的权重。1.4 缺点（1）在一群小的目标聚集在一起的时候，网络的识别效果就非常的差。（2）当目标出现新的尺寸或者配置的时候，网络的预测的效果非常差。（3）主要的错误原因就是定位的不准确，因为是直接预测目标的坐标信息，而不是像fater-rcnn和ssd预测微参数。2 YoloV22.1 性能根据上图可以看出yoloV2最高的检测精度可
复制链接

扫一扫