YoloV1——总结

1.概述

YoloV1是一个快速、准确的目标检测网络,优缺点如下:

优点:

1.具备实时性,网络运行速度超过45fps

3.网络结构简单,端到端

4.可用于多种对象的检测

缺点:

1.目标定位较粗糙

2.对小目标检测不太好

3.每个cell只能生成2个框,并且只能有一个类

2.网络结构

说明:网络有24个卷积层,然后是2个完全连接的层。交替的1×1个卷积层减少了前一层的特征空间。

3.检测过程中的参数

1.输入一张图片

2.系统将图片分割为一个S\times S的网格,如果一个对象的中心落入一个网格单元格中,则该网格单元格负责检测该对象。

3.每个网格单元格预测边界框和这些边界框的置信度分数。这些置信度分数反映了模型对边界框包含物体的信心,也反映了它认为盒子预测的准确性。

confience=Pr(Object)*IOU_{truth}^{pred}

注:如果单元格中不包含对象则Pr(Object)=0,包含对象Pr(Object)=1

4.每个单元格2个预测框,每个框里面有六个参数,分别是x,y,w,h,confidence(x,y)是预测框的中心坐标,w,h分别是预测框的宽和高,confidence是置信度。此外,每个单元格还有一个参数C,其是某几类对象的概率集合。

5.Yolov1最终会将一张图片编码成一个如下张量:

S\times S\times \left ( B*5+C \right )

        其中B是每个单元格的预测框数量。

        在论文中,S=7,B=2,C=20

6.计算每个预测框的得分:

Score=confidence*C

        用这个得分去做后续的非极大值抑制处理(NMS)。最后保留下来的结果,就是网络的最终预测输出。

4.训练

1.作者先在ImageNet1000上预训练前20层卷积层加一个平均池化层和一个全连接层。

2.然后作者又在20层卷积层后面加了4层卷积层和随机初始化权值的完全连接层。

3.作者还把网络的输入从224\times 224增加到了448\times 448

4.作者还基于图像的大小,把预测框的w,h缩放到了0到1之间。

5.网络的最后一层使用的是线性激活函数:

\phi (x)=\left\{\begin{matrix} x, ifx>0\\ 0.1x,otherwise \end{matrix}\right.

6.在每个图像中,许多网格单元格不包含任何对象。这将这些细胞的confidence分数推向零,通常超过了确实包含物体的细胞的梯度。这可能导致模型不稳定,导致训练在早期出现分歧。为了解决这一点,作者增加了边界框坐标预测的损失,并减少了不包含对象的框的一致性预测的损失。

7.误差度量应该反映大预测框的小偏差比预测框的小偏差小。为了部分解决这个问题,我们预测边界框宽度和高度的平方根,而不是直接预测宽度和高度。

5.损失函数

根据引用和引用,yolov8 spp是TensorRT-Alpha库中的一个模型。具体来说,它是基于YOLOv8模型构建的,采用了一个称为sppf的结构。SPPF代表Spatial Pyramid Pooling Fusion,它在YOLOv8的基础上添加了一个空间金字塔池化和融合的步骤。这个结构的目的是提高YOLOv8模型的精度和性能。 而关于YOLOv8模型,根据引用,它是一种目标检测模型,通过将输入图像分成不同尺度的网格单元,并使用卷积操作来预测每个网格单元内是否存在目标以及目标的位置和类别。YOLOv8模型的优点是速度快,适合实时场景,并且具有较高的准确性。 至于您提到的"yolov8 sppf"具体是什么意思,我无法直接得知,因为引用的内容并没有提到这个特定的术语。不过,根据您提供的信息,可以推断出"yolov8 sppf"可能是指在YOLOv8模型中添加了SPPF结构的变种或改进版本。这可能是为了进一步提高模型的性能和准确性。 总结起来,“yolov8 sppf”是一个基于YOLOv8模型的变种或改进版本,其中添加了SPPF结构来提高模型的性能和准确性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [目标检测算法——YOLOV8——算法详解](https://blog.csdn.net/u012863603/article/details/128816715)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值