【论文笔记】:YOLOv8-QSD 自动驾驶场景小目标检测算法

摘要

YOLOv8-QSD网络是一种新型的无锚点驾驶场景检测网络,建立在YOLOv8的基础上,在保证检测精度的同时保持效率。该网络的骨干网采用结构重参数化技术来转换基于多样化分支块 (DBB) 的模型。

为了准确检测小目标,它集成了不同尺度的特征,并在骨干之后实现了基于双向特征金字塔网络(BiFPN)的特征金字塔。

此外,还提出了一个动态头部(DyHead),包含了尺度感知、空间感知和任务感知的注意力机制,以进一步优化特征提取和分类过程。为了解决驾驶场景中远程检测(商业车辆需要更大的视野)的挑战,该文引入新的查询模型(Q-block)和管道结构以解决长距离检测挑战。

测试结果表明,该算法在大规模小目标检测数据集(SODA-A)上的性能无论在速度还是准确率上都优于YOLOv8。 准确率达64.5%,计算量降低7.1 GFLOPs。

YOLOv8与YOLOv8-QSD网络图对比

4c23fc3e67344a03a3426439a4b89a30.png

962713333ac9472786c0a7e6e2b68682.png

算法

难点 

由于小对象的像素尺寸较小,想要从小目标中提取准确、全面的特征尤为重要。在复杂环境中,从重叠对象中提取特征要求更高,往往导致跨算法的小目标检测精度降低。

目标检测中对于小物体的检测精度较低以及计算量较大的问题。

QueryDet

为解决 级联特征金字塔检测中检测小物体的困难 提出了QueryDet

最常见和最有效的方法包括使用高分辨率的图像或特征图。然而,这两种方法都有很高的计算成本,这与图像和特征图的大小成比例,特别是在一个结构化的特征金字塔中。

neck缺陷

原始的YOLOv8网络采用PAFPN作为neck网络,通过双向聚合来自底部和顶部路径的特征来融合低级别和高级别信息,从而有效地缩短了信息路径。然而,在像素级别的分辨率下,直接将p3层与目标层进行融合并不能充分满足定位信息的要求,并且直接融合p2层会显著增加参数数量。

解决方法

YOLOv8-QSD利

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值