一、本文介绍
本文记录的是基于SwinTransformer的YOLOv10目标检测改进方法研究。本文利用SwinTransformer
替换YOLOv10
的骨干网络,Swin Transformer
的作用在于同时包含层次化特征表示和基于移位窗口的自注意力机制,克服了常见 Transformer
模型在视觉任务中面临的尺度差异和分辨率差异问题。本文将其应用到v10
中,使其在保持推理高效的同时,具备大模型的特点。
专栏目录:YOLOv10改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进