yolov6论文翻译

guanshanjushi2

已于 2022-10-12 17:42:44 修改

阅读量1.9k

点赞数 2

分类专栏： yolov6 文章标签：深度学习人工智能目标检测 pytorch 自动翻译

于 2022-10-12 17:27:57 首次发布

本文链接：https://blog.csdn.net/guanshanjushi2/article/details/127284381

版权

本文主要是对yolov6的论文进行翻译，有需要的可以看一下论文

摘要由CSDN通过智能技术生成

摘要

多年来，YOLO系列一直是高效物体检测的事实上的工业级标准。YOLO社区以压倒性的优势丰富了它在众多硬件平台和丰富场景中的应用。在这份技术报告中，我们努力把它的极限推到一个新的水平，以坚定不移的心态向行业应用迈进。考虑到现实环境中对速度和准确性的不同要求，我们广泛地研究了来自工业界或学术界的最新的物体检测进展。具体来说，我们大量吸收了最近的网络设计、训练策略、测试技术、量化和优化方法的思想。在此基础上，我们整合了我们的想法和实践，建立了一套不同规模的可部署的网络，以适应多样化的用例。在YOLO作者的慷慨许可下，我们将其命名为YOLOv6。我们也表示热烈欢迎用户和贡献者的进一步改进。对于性能的表现，我们的YOLOv6-N在COCO数据集上达到了35.9%的AP，在NVIDIA Tesla T4 GPU上的吞吐量为1234 FPS。YOLOv6-S以495 FPS的速度达到了43.5%的AP，超过了其他相同规模的主流检测器（YOLOv5-S、YOLOX-S和PPYOLOE-S）。我们的量化版本YOLOv6-S甚至在869 FPS时带来了新的最先进的43.3%AP。此外，YOLOv6-M/L也比其他具有类似推理速度的检测器取得了更好的准确性表现（即49.5%/52.3%）。我们仔细进行了实验来验证每个组件的有效性。

1、介绍

YOLO系列一直是工业应用中最受欢迎的检测框架，因为它在速度和精度之间有很好的平衡。YOLO系列的开创性工作是YOLOv1-3[32-34]，它开辟了one-stage检测器的新道路，并在后来进行了大幅改进。YOLOv4[1]将检测框架重组为几个独立的部分（backbone, neck and head），并在当时验证了bag-of-freebies和bag-of-specials，设计了一个适合在单个GPU上训练的框架。目前，YOLOv5[10]、YOLOX[7]、PPY-OLOE[44]和YOLOv7[42]都是可以部署的高效检测器的竞争对象。不同尺寸的模型通常是通过缩放技术获得的。

在这份报告中，我们从经验上观察到几个重要的因素，促使我们重新装修YOLO框架：（1）来自RepVGG[3]的重新参数化是一种优越的技术，在检测中还没有得到很好的利用。我们还注意到，RepVGG块的简单模型扩展变得不切实际，为此我们认为小网络和大网络之间网络设计的优雅一致性是不必要的。对于小型网络来说，普通的单路径架构是一个较好的选择，但对于大型模型来说，参数的指数增长和单路径架构的计算成本使其不可行；（2）基于重参数化的检测器的量化也需要细致的处理，否则在训练和推理过程中，由于其异质配置导致的性能下降将是难以处理的。(3) 以前的工作[7, 10, 42, 44]往往不太注意部署，其延迟通常是在V100这样的高成本机器上进行比较。当涉及到真正的服务环境时，存在着硬件差距。通常情况下，像Tesla T4这样的低功耗GPU成本较低，并提供相当好的推理性能。(4) 考虑到架构上的差异，先进的特定领域策略，如标签分配和损失函数设计，需要进一步验证；(5) 对于部署，我们可以容忍训练策略的调整，以提高准确率性能，但不增加推理成本，如知识提炼。

考虑到上述意见，我们带来了YOLOv6的诞生，它在准确性和速度方面完成了迄今为止的最佳权衡。我们在图1中展示了YOLOv6与其他同行在类似规模下的比较。为了在不降低性能的情况下提高推理速度，我们研究了最先进的量化方法，包括训练后量化（PTQ）和量化感知训练（QAT），并将其纳入YOLOv6，以实现部署就绪的目标。网络的目标。