【目标检测】YOLOV3详解

最新推荐文章于 2024-08-05 18:41:17 发布

Aliert

最新推荐文章于 2024-08-05 18:41:17 发布

阅读量1.6w

点赞数 12

分类专栏：计算机视觉文章标签：目标检测深度学习人工智能

本文链接：https://blog.csdn.net/qq_38375203/article/details/125505508

版权

YOLOv3在保持速度优势的同时提升了检测精度，尤其对小物体检测有显著提升。通过DarkNet-53网络结构，采用多尺度预测和改进的训练策略与损失函数，实现多尺度物体检测。网络中使用残差思想，无池化层，以及多层特征图融合。此外，YOLOv3的损失函数考虑了正例、忽略样本和负例，优化了训练过程。

摘要由CSDN通过智能技术生成

前言

前面的V1、V2已经讲完了，再讲解一下YOLOV3了。v3除了网络结构，其余变动不多，主要是将当今一些较好的检测思想融入到了YOLO中，在保持速度优势的前提下，进一步提升了检测精度，尤其是对小物体的检测能力。具体来说，YOLOv3主要改进了网络结构、网络特征及后续计算三个部分。

1、网络架构

YOLOv3继续吸收了当前优秀的检测框架的思想，如残差网络和特征融合等，提出了如图下图所示的网络结构，称之为DarkNet-53。作者在ImageNet上实验发现darknet-53相对于ResNet-152和ResNet101，不仅在分类精度上差不多，计算速度还比ResNet-152和ResNet-101强多了，网络层数也比它们少。

在这里插入图片描述

● DBL：代表卷积、BN及Leaky ReLU三层的组合，在YOLOv3中卷积都是以这样的组合出现的，构成了DarkNet的基本单元。DBL后面的数字代表有几个DBL模块。
● res：res代表残差模块，res后面的数字代表有几个串联的残差模块。
● 上采样：上采样使用的方式为上池化，即元素复制扩充的方法使得特征图尺寸扩大，没有学习参数。
● Concat：上采样后将深层与浅层的特征图进行Concat操作，即通道的拼接，类似于FPN，但FPN使用的是逐元素相加。
● 残差思想：DarkNet-53借鉴了ResNet的残差思想，在