【yolov3】yolov3原理详解

computer_vision_chen

已于 2023-09-27 11:44:39 修改

阅读量482

点赞数

分类专栏：目标检测文章标签： YOLO 深度学习目标检测

于 2023-09-27 10:47:15 首次发布

本文链接：https://blog.csdn.net/qq_42864343/article/details/133342396

版权

目标检测专栏收录该内容

14 篇文章 2 订阅

订阅专栏

yolov4，yolov5都是在yolov3的基础上做的更改。

一.yolov3骨干网络

52个卷积层，一个全连接层，并且里面加了残差连接。

在这里插入图片描述

每一层的输入输出大小图

在这里插入图片描述

二.输入输出

如上图所示

输入 416x416x3
输出 三个 feature map
13x13x255
26x26x255
52x52x255

输出的255是怎么来的？

每个gred cell生成三个锚框，每一个锚框对应一个预测框，每一个预测框有 5(x,y,w,h,置信度) + 80(80个类别的条件概率) 
3x85=255

多尺度输出的作用

一共9个锚框，一个尺度分配三个
grid cell为13x13，对应输入图像的感受野是32x32
grid cell为26x26，对应输入图像的感受野是16x16
grid cell为52x52，对应输入图像的感受野是8x8

13x13负责预测大物体，分配大的锚框。
26x26负责预测中等大小的物体，分配中等大小的锚框。
52x52负责预测小物体，分配小的锚框。

三.正样本负样本

在这里插入图片描述
假如蓝框是真实框，那么与蓝框IOU最大的是正样本。
与蓝框IOU超过一个阈值，但IOU不是最大，则不参与
与蓝框IOU低于一个阈值，则为负样本

四.yolov3损失函数

在这里插入图片描述

正样本对中心点坐标进行回归
正样本的置信度和类别损失：正样本置信度标签为1
负样本置信损失：负样本置信度标签为0

五.训练过程

在这里插入图片描述

六.测试过程

在这里插入图片描述

去掉置信度小于某个阈值的框
再用NMS将同一个物体重复预测的框去掉

NMS原理：按照置信度排序，取最大的置信度的框，让它与其它框做IOU，当IOU与置信度最大的框超过某个阈值，就视为与置信度最大的框重复预测，就把它去掉。然后再找出除上一个最大的置信度框之外最大的置信度框，重复上述过程

优点

在这里插入图片描述

即发挥了深层网络抽象的特征。
也充分利用了浅层网络细粒度，像素级的信息。

可以对不同尺度的物体进行预测。

补充

下采样

在卷积神经网络中，下采样通常是指对输入数据进行降采样，以减少数据的维度和计算复杂度。下采样倍数表示采样后的数据相对于原数据的减少比例。

如果下采样倍数为3，那么采样后的数据量将是原数据量的1/3。下采样可以通过池化（pooling）或丢弃（discarding）数据等方式实现。

例如，对于一个输入数据为100x100的图像，如果进行3x3的下采样操作，那么采样后的图像大小将为33x33。这样可以减少网络的输入大小，从而减少计算量和过拟合的风险，同时保留重要特征，提高模型的泛化能力。

需要注意的是，下采样倍数并不是任意设定的，它通常根据具体任务和数据集来确定，同时也需要考虑采样的效果和计算资源之间的平衡。