死嗑YOLO系列(三),YOLOv3风月无边

YOLOv3在保持快速的同时提升了目标检测的准确性,其核心在于多尺度预测和改进的特征提取器。文章详细探讨了bbox预测、class预测、多尺度预测以及YOLOv3的anchor机制。通过对Darknet-53网络的理解,揭示了YOLOv3在小目标检测上的进步,并分析了不同tricks的效果。
摘要由CSDN通过智能技术生成

YOLOv2 的时候,作者在 YOLOv1 的基础上运用了许多有效的 tricks,所以展示了它的 better、faster、stronger 因素,到了 YOLOv3 的时候,这个模型仍然在进化,保持速度的同时,把准确率给提升了许多。

速度始终是YOLO系列安身立命之本.

我面试过许多的求职者,大家在日常工作当中,最常用的模型还是 YOLO,这说明 YOLO 真的成为了工业界的事实标准,尤其是在边缘设备。

在这里插入图片描述
这是极具挑衅的一张性能对比图。

以实时性要求为分界,这世界上只有 2 种算法,YOLOv3 和其它。

他山之石可以攻玉

YOLO 作者是个很实诚的人,在论文中有解释道 YOLOv3 的改进借助于其他同行的很多 ideal。

bbox 预测

从 YOLOv2 开始,预测 bbox 就是借助于 anchor box。
anchor box 是通过尺寸聚类计算出来的。
每一个 bbox 预测 5 个数值,前 4 个为 tx,ty,tw,th,后 1 个为 ojectness score.

尺寸相关的预测值如下图:
在这里插入图片描述
tx,ty,tw,th 4 个是预测出来的值,最终通过上面公式得到归一化的数值:bx,by,bw,bh。
在这里插入图片描述
这里极具迷惑性的是,如何通过 bx,by,bw,bh 得到 bbox 的位置尺寸?

因为论文讲得不是很明白,所以需要结合自己的理解去做推断。

bx 是 tx 经过 sigmoid 转换,加上 cx 的结果。

因为 sigmoid 的函数取值是 0 到 1,所以 bx 的取值范围是 cx ~ cx + 1。

这显然不是在原始的输入图像上的位置关系。

实际上,YOLOv3 所有的检测都是在最后一层 featuremap 上的。

YOLOv3 产生了 3 个分支,分别产生了 13x13,26x26,52x52 三种尺寸的 featuremap。

每个 featuremap 的一个像素,也就一个点会生成 3 个 AnchorBox,所以,每个 AnchorBox 距离 featuremap 原点的距离也就是上图中的 cx,cy 是固定的,所以也可以解释了一些同学的疑问,cx 和 cy 要不要预测。

pw 和 ph 是 AnchorBox 的尺寸,这个尺寸也是基于 featuremap 而言的。

另外,有同学可能会注意 bw 和 bh 的公式。
b w = p w ∗ e t w b_{w} = p_{w}*e^{tw} b

### 回答1: 这是关于使用 YOLOv5 深入浅出的问题。YOLOv5 是目标检测领域的一种深度学习框架,它建立在 YOLO 系列的基础上,具有更快的速度和更高的精度。YOLov5 的核心基础知识包括卷积神经网络目标检测算法等。 ### 回答2: 目前,Yolo系列算法已经成为了目标检测领域的主流算法之一。其中,Yolov5作为Yolo系列的最新版本,相比之前版本,在检测速度和精度上都有了大幅度的提升。本文将从以下四个方面对Yolov5进行深入浅出地解析。 一、Yolov5基础框架 Yolov5的基础框架由个主要部分组成,分别是:Backbone、Neck和Head。Backbone通常采用的是骨干网络,如ResNet、EfficientNet等,用于提取图像特征。Neck是用来融合不同层级的特征图,一般采用的是FPN(Feature Pyramid Network)或PAN(Path Aggregation Network)。Head是由若干个卷积层和全连接层组成的一个模块,用于进行目标检测。 二、Yolov5中的anchor boxes 在目标检测中,anchor boxes是非常重要的一部分。在Yolov5中,anchor boxes是通过k-means算法进行聚类得到的。这里的k-means算法是针对训练集中目标的大小进行的聚类,目的是得到最适合的anchor boxes尺寸。 Yolov5网络结构的变化 相比于Yolov4,Yolov5在网络结构上的变化主要包括:去掉了大量瓶颈块,增大了通道数,增加了下采样层数,减少了最大池化层。这些变化都是为了提高检测速度和准确率。 四、Yolov5的训练技巧 在训练阶段,Yolov5采用了GIoU损失函数和Mosaic数据增强方式。GIoU损失函数是一种与边框大小无关的、能够有效地惩罚预测框的偏移和错位的损失函数。而Mosaic数据增强方式则是一种结合了多张图像的数据增强方式,在提高数据样本多样性的同时还能有效避免过拟合。 综上所述,Yolov5作为Yolo系列的最新版本,不仅在检测速度和准确率上有了大幅提升,还采用了一系列新的训练技巧。对于从事目标检测研究的人员来说,了解和掌握Yolov5的核心基础知识是非常重要的。 ### 回答3: YOLOv5是一种新的目标检测算法,它通过使用深度学习技术来实现图像中物体的检测。这个算法具有很高的准确率和比较快的处理速度,因此在实际应用中得到了广泛的应用。下面来深入浅出的讲解YOLOv5的基础知识。 1、YOLOv5的特点:YOLOv5采用的是深度学习技术,利用神经网络对图像进行处理,从而实现物体检测。它的特点是速度快,准确率高。相比传统的目标检测方法,YOLOv5还可以同时处理多个物体的检测,所以它比较适合用于实时场景中的物体检测。 2、YOLOv5的网络结构:YOLOv5采用的是一种叫做YOLOv4的网络结构,它是一种非常复杂的卷积神经网络模型。整个网络分为多个层次,每一层都是由卷积、池化、激活函数等多个操作组成。通过这些层级的处理,YOLOv5可以进行对图像的特征提取,并最终输出每个物体的位置和类别。 3、YOLOv5的训练过程:YOLOv5的训练过程是一个比较复杂的过程,需要利用大量的标注好的图像数据进行训练。这个过程需要用到一些特殊工具和方法,比如数据增强、批量训练、学习率调整等。通过这些方法,YOLOv5可以不断地优化自己的检测能力,从而提升对物体的检测准确率。 4、YOLOv5的应用场景:YOLOv5的应用场景非常广泛,可以应用于工业生产、安防监控、交通管理等多个领域。比如在工业生产中,可以用来对自动化生产线上的产品进行检测;在安防监控中,可以用来对物体进行追踪和识别;在交通管理中,可以用来对车辆、行人等进行检测和统计。 以上就是YOLOv5的核心基础知识的完整讲解了,希望能对大家有所启发。总的来说,YOLOv5是一种比较先进的目标检测算法,其准确率和速度都较高,可以应用于多个领域。但是其训练过程比较复杂,需要有一定的专业知识和技能才能够进行有效的训练和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

frank909

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值