YOLOV1学习总结


本文是对【同济子豪兄】对YOLOV1讲解所做得总结

预测阶段01

在这里插入图片描述
输入图像经过卷积神经网络后,输出7x7x30的向量。7x7表示将输入图像分为7x7个grid cell, 每个grid cell生成两个预测框,如下图所示,

在这里插入图片描述

每个预测框包含5个数据:x, y, w, h, c (c表示该框预测到物体的概率),预测框的边缘线越粗,其c值就越大。
由于使用的是Pascal VOC 数据集,共20个预测类别,所以每个grid cell包含30个数据(2*5 + 20 = 30),20表示该 grid cell 预测结果为某一类别的概率。
下图表示每个grid cell预测的类别,每个grid cell只能预测一个类别。

在这里插入图片描述

预测阶段02-NMS

1.将每个 grid cell 的两个 bbox 预测的20个类别的概率按照下图的方式排列:其中bb1的20个数值表示,该bbox置信度 x 20个预测类别的概率

在这里插入图片描述

假如第一排为dog的预测概率,将其排列如下:

在这里插入图片描述

按照从高到低的顺序排列,从第二个bbox开始,依次拿每个bbox的概率与第一个bbox的概率比较,如果IOU大于阈值,证明这两个bbox预测的为同一个物体,将后面的bbox的预测概率置0。如果IOU小于阈值,则不做改变。再依次和第二个bbox的概率进行比较,如下图所示:

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

训练阶段

深度学习(监督学习)的训练,是通过梯度下降和反向传播的方法,迭代地去微调神经元中的权重,来使得损失函数最小化的过程。
如图所示,绿色圆点为ground truth的中心点,其所在的 grid cell 生成的bbox用来预测该ground truth。
1、2号框均为同一个 grid cell 的 bbox, 1号框与 ground truth 的IOU较大,因此由1号框负责拟合该ground truth, 损失函数的设计目的就是尽可能让1号框与3号框一致。
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
yolov1-yolov5是一系列基于深度学习目标检测算法,以下是它们的主要特点和改进之处: - yolov1yolo系列的第一个版本,它采用了单个卷积神经网络来进行目标检测。整体思想是将输入图像分成网格,并在每个网格中预测边界框和类别。然后使用非极大值抑制来排除重叠的边界框,最终得到检测结果。 - yolov2是yolo系列的第二个版本,相比yolov1做了许多改进。其中包括使用批量归一化(batch normalization)来加速训练过程,引入更高分辨率的分类器(hi-res classifier)来提高检测精度,引入先验框(anchor boxes)和维度聚类(dimension priors)来更好地预测边界框的位置和尺寸。 - yolov3是yolo系列的第三个版本,它在yolov2的基础上进行了进一步的改进。主要的改动包括引入了残差网络(resnet)来提高特征提取的效果,使用多尺度预测来提高对不同大小目标的检测能力,并采用多标签分类网络来增加模型的表达能力。 - yolov4是yolo系列的第四个版本,它在yolov3的基础上进行了一系列优化和改进。其中包括使用更深的网络结构、引入更多的技巧来提高训练和推理速度,使用焦点损失函数(focal loss)来解决类别不平衡问题,引入自适应形态匹配(Adaptive Spatial Matching)等技术来提高检测的精度和稳定性。 - yolov5是yolo系列的最新版本,它在yolov4的基础上进行了一些改进。主要包括使用更轻量级的网络结构,引入新的数据增强方法和训练策略,以及改进的损失函数等。yolov5在保持检测精度的同时,显著提升了推理速度和模型大小。 总结来说,yolov1-yolov5是一系列不断改进的目标检测算法,它们在网络结构、特征提取、损失函数等方面进行了不同的改进和优化,从而不断提高了检测精度和速度。每个版本都有自己的特点和改进之处,选择适合的版本取决于具体的应用场景和需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值