【论文笔记】：YOLOv8-QSD 自动驾驶场景小目标检测算法

hhhhhhkkkyyy

已于 2024-08-18 13:46:27 修改

阅读量1.6k

点赞数 15

文章标签：论文阅读自动驾驶目标检测 YOLO

于 2024-08-07 18:06:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80365008/article/details/140956908

版权

摘要

YOLOv8-QSD网络是一种新型的无锚点驾驶场景检测网络，建立在YOLOv8的基础上，在保证检测精度的同时保持效率。该网络的骨干网采用结构重参数化技术来转换基于多样化分支块（DBB）的模型。

为了准确检测小目标，它集成了不同尺度的特征，并在骨干之后实现了基于双向特征金字塔网络（BiFPN）的特征金字塔。

此外，还提出了一个动态头部(DyHead)，包含了尺度感知、空间感知和任务感知的注意力机制，以进一步优化特征提取和分类过程。为了解决驾驶场景中远程检测（商业车辆需要更大的视野）的挑战，该文引入新的查询模型（Q-block）和管道结构以解决长距离检测挑战。

测试结果表明，该算法在大规模小目标检测数据集（SODA-A）上的性能无论在速度还是准确率上都优于YOLOv8。准确率达64.5%，计算量降低7.1 GFLOPs。

YOLOv8与YOLOv8-QSD网络图对比

算法

难点

由于小对象的像素尺寸较小，想要从小目标中提取准确、全面的特征尤为重要。在复杂环境中，从重叠对象中提取特征要求更高，往往导致跨算法的小目标检测精度降低。

目标检测中对于小物体的检测精度较低以及计算量较大的问题。

QueryDet

为解决级联特征金字塔检测中检测小物体的困难提出了QueryDet

最常见和最有效的方法包括使用高分辨率的图像或特征图。然而，这两种方法都有很高的计算成本，这与图像和特征图的大小成比例，特别是在一个结构化的特征金字塔中。

neck缺陷

原始的YOLOv8网络采用PAFPN作为neck网络，通过双向聚合来自底部和顶部路径的特征来融合低级别和高级别信息，从而有效地缩短了信息路径。然而，在像素级别的分辨率下，直接将p3层与目标层进行融合并不能充分满足定位信息的要求，并且直接融合p2层会显著增加参数数量。

解决方法

YOLOv8-QSD利

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。