YoloV1-V3

1 YoloV1

1.1 论文思想

在这里插入图片描述

1.2 网络结构在这里插入图片描述

在这里插入图片描述

1.3 损失函数

在这里插入图片描述
在这里插入图片描述

通过开根号设计可以使得,小的bbox loss有较大权重,大的bbox有较小的权重。

1.4 缺点

在这里插入图片描述
(1)在一群小的目标聚集在一起的时候,网络的识别效果就非常的差。
(2)当目标出现新的尺寸或者配置的时候,网络的预测的效果非常差。
(3)主要的错误原因就是定位的不准确, 因为是直接预测目标的坐标信息,而不是像fater-rcnn和ssd预测微参数。

2 YoloV2

2.1 性能

在这里插入图片描述

根据上图可以看出yoloV2最高的检测精度可以达到78.6(YOLOv2 544544),FPS最好可以达到67(YOLOv2 416416)

2.2 yoloV2比yoloV1上所作的尝试

1 Batch Normalization
在这里插入图片描述
2 High Resolution Classifier (更高分辨率的分类器)
在这里插入图片描述
传统的图像大小为224224的,这里作者采用448448的图像,做fine tune时结果可以提高4%mAP。
3 Convoltional With Anchor Boxes
在这里插入图片描述
在没有使用了Anchor时,精度为69.5mAP,召回率为81%,在使用了Anchor时,精度为69.2mAP,精度为88%,召回率的提高7个点。
4 Dimension Clusters
在这里插入图片描述
采用k-means聚类的方法获得Anchor的数量
5 Direct location prediction
在这里插入图片描述
6 Fine-Grained Features
在这里插入图片描述
在这里插入图片描述
7 Multi-Scale Training
在这里插入图片描述
每10个epoch之后改变网络的输入,输入的大小为32的倍数,{320,352,…,608},最大的尺寸为608。

2.3模型框架

在这里插入图片描述
在这里插入图片描述

2.4 模型训练

在这里插入图片描述

2.4 相关连接

github:
https://github.com/WZMIAOMIAO/deep-learning-for-image-processing
CSDN:
https://blog.csdn.net/qq_37541097/article/details/103482003
bilibili:
https://space.bilibili.com/18161609/channel/index

2.5 缺点

在预测小目标的时候,效果任然不好。

3 YOLOv3

3.1 性能

在这里插入图片描述
在这里插入图片描述
横坐标是网络的推理时间。

3.2 网络结构

在这里插入图片描述
Darknet-53中没有池化层,这里用卷积层代替了池化层,每个模块后使用Convolution之后,size变为原来的1/2。(个人理解是,因为这里使用的conv代替的pooling,因而使得网络的检测速度变化)。因为网络的的参数比ResNet-152少,所以检测速度快。
当Convolutional中有BN时,Conv2d就不需要添加bias。
在这里插入图片描述
在这里插入图片描述

3.3 数据的处理

目标边界框的预测
在这里插入图片描述

正负样本的匹配
一张图片中有几个正样本就有几个ground truth的目标。
在这里插入图片描述
分配的原则
(1)与ground truth重合度最大的目标设置为正样本,当重合度大于某个阈值但是不是最大的重合度的时候,则将该样本忽略,并且将其他的bounding box设置为负样本。
(2)如果一个bounding box prior没有指定ground truth,则该样本即没有 loss for coordinate也没有class predictions loss,只有objectness。

3.4 损失的计算

在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/20200921180158221.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zNTg0ODk2Nw==,size_16,color_FFFFFF,t_70#pic_center
在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值