YOLO系列笔记（四）——YOLO v3介绍

天蓝今天不要咸鱼！

已于 2024-04-12 22:12:32 修改

阅读量743

点赞数 14

文章标签：计算机视觉 YOLO 深度学习笔记

于 2024-04-12 21:24:42 首次发布

本文链接：https://blog.csdn.net/XISHI_TIANLAN/article/details/137630639

版权

YOLO v3

YOLO v3 是 YOLO 系列中的一种先进的实时目标检测网络，它在效率和速度方面相较于其前身有显著提升。此版本特别优化了网络结构，以改善小目标的检测能力，综合利用多尺度特征图信息以预测不同大小的物体。它采用了丰富的先验框设计，每个尺度提供三种不同规格，共计九种先验框。
在这里插入图片描述

无池化和全连接层：全部采用卷积层，以保持空间特征的丰富性。
下采样：通过将 stride 设为 2 来实现，而不是采用传统的池化操作。
- 残差连接：借鉴了 ResNet 的设计，通过堆叠更多的层来提升特征提取效率，并采用残差连接以避免训练过程中的梯度消失问题（残差网络结构见下图左一，单纯的VGG网络层数叠加并不能提升运行速度和准确性，见图右一、二：不采用残差网络的话，层数越多，训练和测试的误差越高）。
图像金字塔：利用不同的特征图进行融合后预测，以实现对物体尺寸的敏感性。