YOLOV5改进：即插即用! | 国防科大联合慕尼黑工业大学提出新型解耦头 TSCODE: 助力目标检测器轻松涨点！

移动开发经验汇总

于 2023-10-05 12:45:50 发布

阅读量180

点赞数

分类专栏： YOLOV5/YOLOV7/YOLOV8有效改进方式文章标签： YOLO python 信息可视化计算机视觉目标跟踪

本文链接：https://blog.csdn.net/2201_76125261/article/details/133554602

版权

YOLOV5/YOLOV7/YOLOV8有效改进方式专栏收录该内容

45 篇文章 59 订阅 ¥49.90 ¥99.00

订阅专栏

国防科大与慕尼黑工业大学合作推出TSCODE，这是一种新型的解耦头，旨在改善目标检测器的分类和定位性能。TSCODE通过分离不同层次的特征，优化了YOLOV5的结构，使得分类和定位任务能够利用更适宜的特征信息。该解耦头是即插即用的，可轻松集成到多种目标检测框架中，如YOLO系列。文章详细介绍了如何在YOLOV5 v7.0中实现这一改进，并提供了具体的步骤和代码示例。

摘要由CSDN通过智能技术生成

分类和定位是目标检测中两个高度相关但互相“矛盾”的任务。对于每个对象，分类属于粗粒度的戏细分任务，需要更丰富的语义上下文，而定位则相当细粒度，需要能提供更多丰富细节的边界信息。这一点不难理解，分类通常需要站在全局的角度去审时度势，这也是为什么大多数分类任务会采用全局上下文池化(Global Average Pooling, GAP)的原因。

如上所述，诸如YOLOX等常规的解耦头设置中，分类和回归分支都是共享来自Neck输出的相同输入特征。虽然它们使用单独的参数进行学习，以便为每个任务提供不同的特征上下文，即参数解耦，但这种简单的设计并不能从本质上解决问题。这是因为不同的输入特征其涵盖的语义和空间细节信息是并相同的。通常来说，低层特征具备更丰富的细节信息而缺乏语义信息，而高层特征则与之相反，这必然不能最大限度的发挥这种“解耦头”的优势。

如图所示，TSCODE整体的网络架构与常规的单阶段目标检测器并无多大差异，都是包含Backbone、Neck和Head。其中骨干网络充当特征提取器从输入图像生成多尺度特征图。随后通过类似于FPN或BiFPN之类的特征金字塔结构进行深、浅层的特征融合，最后再分别输入到头部进行相应的解码输出。需要注意的是，这里TSCODE接收来自中间三个层级输出的特征图，并生成用于分类和定位的解耦特征图。更重要的是，TSCODE是即插即用的，可以很容易地集成到大多数流行的检测器中，无论是Anchor-based还是Anchor-free

了解本专栏

移动开发经验汇总

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
YOLOV5改进：即插即用! | 国防科大联合慕尼黑工业大学提出新型解耦头 TSCODE: 助力目标检测器轻松涨点！

输出的相同输入特征。虽然它们使用单独的参数进行学习，以便为每个任务提供不同的特征上下文，即参数解耦，但这种简单的设计并不能从本质上解决问题。通常来说，低层特征具备更丰富的细节信息而缺乏语义信息，而高层特征则与之相反，这必然不能最大限度的发挥这种“解耦头”的优势。对于每个对象，分类属于粗粒度的戏细分任务，需要更丰富的语义上下文，而定位则相当细粒度，需要能提供更多丰富细节的边界信息。7.val.py的144行加入一行代码，如果需要使用detect.py文件，对应的stride也要修改为64，加一行代码即可。
复制链接

扫一扫