YOLOv5(6.1)结合ASFF(自适应空间融合）

_Z1po_

已于 2023-04-26 21:58:00 修改

阅读量3.1k

点赞数 5

文章标签： YOLO python ASFF

于 2023-03-05 21:37:21 首次发布

本文链接：https://blog.csdn.net/komorebi123_/article/details/129351352

版权

文章介绍了在YOLOv5网络中添加ASFF（自适应空间融合）模块时遇到的代码问题，包括`forward`函数定义错误和ASFF_Detect类缺失部分代码。通过修复这些问题，成功实现了YOLOv5与ASFF的结合，涉及了对不同层级特征的处理和权重分配。此外，还提供了在yolo.py文件中修改模型类和解析模型函数的步骤，以及更新配置文件的说明。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在给自己的网络添加ASFF，碰到蛮多问题，

一处是common.py文件中加入ASFFV5时，forward函数定义问题
一开始复制的代码x未被定义，会报错，如下：

重新定义即可：
一处是复制的ASFF_Detect类缺少一部分，后面找到了补齐的代码，下面已给出。

以下是YOLOv5(6.1)结合ASFF(自适应空间融合）的全流程：

1. common.py文件中加入ASFFV5

# ASFF
class ASFFV5(nn.Module):
    def __init__(self, level, multiplier=1, rfb=False, vis=False, act_cfg=True):
        """
        ASFF version for YoloV5 .
        different than YoloV3
        multiplier should be 1, 0.5
        which means, the channel of ASFF can be
        512, 256, 128 -> multiplier=1
        256, 128, 64 -> multiplier=0.5
        For even smaller, you need change code manually.
        """
        super(ASFFV5, self).__init__()
        self.level = level
        self.dim = [int(1024 * multiplier), int(512 * multiplier),
                    int(256 * multiplier)]
        # print(self.dim)

        self.inter_dim = self.dim[self.level]
        if level == 0:
            self.stride_level_1 = Conv(int(512 * multiplier), self.inter_dim, 3, 2)

            self.stride_level_2 = Conv(int(256 * multiplier), self.inter_dim, 3, 2)

            self.expand = Conv(self.inter_dim, int(
                1024 * multiplier), 3, 1)
        elif level == 1:
            self.compress_level_0 = Conv(
                int(1024 * multiplier), self.inter_dim, 1, 1)
            self.stride_level_2 = Conv(
                int(256 * multiplier), self.inter_dim, 3, 2)
            self.expand = Conv(self.inter_dim, int(512 * multiplier), 3, 1)
        elif level == 2:
            self.compress_level_0 = Conv(
                int(1024 * multiplier), self.inter_dim, 1, 1)
            self.compress_level_1 = Conv(
                int(512 * multiplier), self.inter_dim, 1, 1)
            self.expand = Conv(self.inter_dim, int(
                256 * multiplier), 3, 1)

        # when adding rfb, we use half number of channels to save memory
        compress_c = 8 if rfb else 16
        self.weight_level_0 = Conv(
            self.inter_dim, compress_c, 1, 1)
        self.weight_level_1 = Conv(
            self.inter_dim, compress_c, 1, 1)
        self.weight_level_2 = Conv(
            self.inter_dim, compress_c, 1, 1)

        self.weight_levels = Conv(
            compress_c * 3, 3, 1, 1)
        self.vis = vis

    def forward(self, x):  # l,m,s
        """
        # 128, 256, 512
        512, 256, 128
        from small -> large
        """
        x_level_0 = x[2]  # l
        x_level_1 = x[1]  # m
        x_level_2 = x[0]  # s
        # print('x_level_0: ', x_level_0.shape)
        # print('x_level_1: ', x_level_1.shape)
        # print('x_level_2: ', x_level_2.shape)
        if self.level == 0:
            level_0_resized = x_level_0
            level_1_resized = self

最低0.47元/天解锁文章