【实习记录】yolo学习

本文详细介绍了YOLO(You Only Look Once)目标检测算法的发展历程,从YOLO-V1到YOLO-V5,包括各版本的结构、改进点、损失函数和优缺点。YOLO以其快速的运行速度和实时性在目标检测领域占有一席之地。随着版本的升级,YOLO在定位精度和处理小目标的能力上不断提升,如YOLO-V2引入Anchor机制,YOLO-V3采用Darknet-53网络和多尺度特征融合,YOLO-V4则进一步优化了网络结构,引入了CSPDarknet53、SPP和PANet等技术。
摘要由CSDN通过智能技术生成

今天的学习参考YOLO系列算法精讲:从yolov1至yolov5的进阶之路(2万字超全整理)采用yoloV5+pycharm的自己数据集训练目标检测与识别等文章。

目录

一、YOLO介绍和下载

二、YOLO-V1

(1)结构

 (2)实现过程

(3)损失函数

(4)缺点

三、YOLO-V2

(1)卷积核的计算

(2)1*1卷积核的作用

1.升维/降维

2. 增加网络深度(加非线性)

3.跨通道信息交互

(3)改进方法

1.Batch Normalization批量标准化

2.Anchor Box

3.细粒度特征

四、YOLO-V3

(1)Darknet-53

和YOLO-V2的区别

 多尺度特征融合

损失函数

多标签分类

五、YOLO-V4

(1)CSPDarknet53

(2)SPP

(3)PANet

六、YOLO-V5 


一、YOLO介绍和下载

    YOLO(You Only Look Once)是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度很快,可以用于实时系统。用于做目标检测。

二、YOLO-V1

详细内容请查看:YOLO系列算法精讲:从yolov1至yolov5的进阶之路(2万字超全整理)

(1)结构

在这里插入图片描述

  • 网络输入:448×448×3的彩色图片。
  • 中间层:由若干卷积层和最大池化层组成,用于提取图片的抽象特征。
  • 全连接层:由两个全连接层组成,用来预测目标的位置和类别概率值。
  • 网络输出:7×7×30的预测结果

 (2)实现过程

S×S 个网格,每个网格要预测 B个bounding box ,还要预测 C 个类。网络输出就是一个 S × S × (5×B+C) 的张量。

  • 将一幅图像分成 S×S个网格(grid cell),如果某个 object 的中心落在这个网格中,则这个网格就负责预测这个object。
  • 每个网格要预测 B 个bounding box,每个 bounding box 要预测 (x, y, w, h) 和 confidence 共5个值。
  • 每个网格还要预测一个类别信息,记为 C 个类。在实际过程中,YOLOv1把一张图片划分为了7×7个网格,并且每个网格预测2个Box(Box1和Box2),20个类别。所以实际上,S=7,B=2,C=20。那么网络输出的shape也就是:7×7×30。

(3)损失函数

  •  损失由三部分组成,分别是:坐标预测损失置信度预测损失类别预测损失
  • YOLO-V1算法中简单的全部采用了均方误差来计算损失函数。
  • 结合实现过程的实际情况,我们可以从上图看到,坐标损失为8维(黄色),置信度损失有两个(绿色),类别损失有20维(蓝色)。8维的坐标损失,两个置信度损失和20维的类别损失同等重要显然是不合理的。因此采用权重系数来进行平衡,对于不同的损失用不同的权重。 
  • bounding box的w和h取平方根代替原本的w和h。
  • 定位误差比分类误差更大,所以增加对定位误差的惩罚,因此\lambda _{coord} = 5
  • 当网格单元不包含任何目标时,训练的过程中就会把这些网格里的框的“置信度”分数推到零,从而可能导致模型不稳定,训练早期发散。因此要减少了不包含目标的框的置信度预测的损失,使 {\color{Red} \lambda _{noobj} = 0.5} 。有object的box的置信度损失类别的loss的loss weight正常取1

损失函数的详细内容请看:目标检测模型YOLO-V1损失函数详解 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值