mamba复现—mamba+yolov8魔改（win）

最新推荐文章于 2024-06-20 09:35:25 发布

锁我喉是吧

最新推荐文章于 2024-06-20 09:35:25 发布

阅读量2.6k

点赞数 28

分类专栏： vmamba mamba yolov8 文章标签： YOLO mamba CBAM

本文链接：https://blog.csdn.net/qq_43767886/article/details/138537178

版权

mamba 同时被 3 个专栏收录

3 篇文章 3 订阅

订阅专栏

vmamba

2 篇文章 0 订阅

订阅专栏

yolov8

2 篇文章 0 订阅

订阅专栏

Mamba复现出现的问题

安装下列步骤一步步走

一、

注：若是Windows环境下python一定是3.10版本的，要不然trition无法安装

conda create -n mamba python=3.10
conda activate mamba 
conda install cudatoolkit==11.8 -c nvidia
pip install torch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 --index-url https://download.pytorch.org/whl/cu118
conda install -c "nvidia/label/cuda-11.8.0" cuda-nvcc
conda install packaging

二、安装trition

由于是先在Windows10上进行调试，然后再在linux服务器上进行跑实验，所以这里先以Windows为准，
Windows下的trition无法直接pip，需要对其源码进行修改，网上有大神编译了Win下的二进制文件的安装包，但是只适用于python3.10！！！
下载到本地后，在anacoda终端中，切换到tritan所在文件夹，输入pip install 进行安装。

pip install triton-2.0.0-cp310-cp310-win_amd64.whl

三、安装causal-conv1d、mamba-ssm

causal-conv1d == 1.1.1
mamba-ssm 1.1.2
（亲测有效，有博主mamba-ssm1.1.1，我试了会报错）

方法一：

1、causal-conv1d

由于是Windows下，所以采用源码安装，去git上下载（https://gitcode.com/Dao-AILab/causal-conv1d/tags?utm_source=csdn_github_accelerator&isLogin=1），
下载到本地后解压，然后切换到该文件下，输入pip install .进行安装，可能会出现以下报错，

User
WARNING: Ignoring invalid distribution -orch (c:\users\16786\.conda\envs\yolov8\lib\site-packages)
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collecting mamba-ssm
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/d3/12/dc792f3136fc8969ac6404f091135ab1aa9260a978a625a77a3cce5299dd/mamba_ssm-1.2.0.post1.tar.gz (34 kB)
  Preparing metadata (setup.py) ... error
  error: subprocess-exited-with-error

  × python setup.py egg_info did not run successfully.
  │ exit code: 1
  ╰─> [11 lines of output]
      Traceback (most recent call last):
        File "<string>", line 2, in <module>
        File "<pip-setuptools-caller>", line 34, in <module>
        File "C:\Users\16786\AppData\Local\Temp\pip-install-qnerb67y\mamba-ssm_d5a352e22e5a430989b40813c061fa67\setup.py", line 103, in <module>
          raise RuntimeError(
      RuntimeError: mamba_ssm is only supported on CUDA 11.6 and above.  Note: make sure nvcc has a supported version by running nvcc -V.


      torch.__version__  = 1.13.1+cu117


      [end of output]

  note: This error originates from a subprocess, and is likely not a problem with pip.
error: metadata-generation-failed

× Encountered error while generating package metadata.
╰─> See above for output.

note: This is an issue with the package mentioned above, not pip.
hint: See above for details.

原因有两种，
1）有时候缓存文件可能会导致安装出错。你可以尝试清理 pip 或 conda 的缓存

pip cache purge

2）由于cuda版本不对，我这边遇到的情况是版本不对，于是乎我又安装了CUDA11.8和CUDNN，就是双CUD环境，因为其他模型需要11.2的CUDA。
在这里插入图片描述
然后再输入pip install .就可以了。

之后在mamba源码 setup.py修改配置

FORCE_BUILD = os.getenv("MAMBA_FORCE_BUILD", "FALSE") == "FALSE"
SKIP_CUDA_BUILD = os.getenv("MAMBA_SKIP_CUDA_BUILD", "FALSE") == "FALSE"

2、mamba-ssm

pip install mamba-ssm，有时候会出错

方法二：

下载causal-conv1d：

Dao-AILabcausal-conv1d
mamba-ssm：
state-spacesmamba
我的causal-conv1d 正常安装了，所以这边以mamba-ssm为例，下载后
pip install mamba_ssm-1.1.1+cu118torch2.1cxx11abiTRUE-cp310-cp310-linux_x86_64.whl
在这里插入图片描述

causal-conv1d文件下下载界面如下在这里插入图片描述
安装成功

也可以直接拉取Docker镜像

参考：直接使用Mamba基础环境docker镜像

此时可以进行mamba的编译了，但是会出现没有模块selective_scan_cuda，

方法一：

此时我们可以将mamba_ssm->ops/selective_scan_interface.py 的import selective_scan_cuda注释掉，然后对该文件的selective_scan_fn和mamba_inner_fn函数进行修改。

###原代码
def selective_scan_fn(u, delta, A, B, C, D=None, z=None, delta_bias=None, delta_softplus=False,
                     return_last_state=False):
    """if return_last_state is True, returns (out, last_state)
    last_state has shape (batch, dim, dstate). Note that the gradient of the last state is
    not considered in the backward pass.
    """
    return SelectiveScanFn.apply(u, delta, A, B, C, D, z, delta_bias, delta_softplus, return_last_state)


def mamba_inner_fn(
    xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,
    out_proj_weight, out_proj_bias,
    A, B=None, C=None, D=None, delta_bias=None, B_proj_bias=None,
    C_proj_bias=None, delta_softplus=True
):
    return MambaInnerFn.apply(xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,
                              out_proj_weight, out_proj_bias,
                              A, B, C, D, delta_bias, B_proj_bias, C_proj_bias, delta_softplus)

##修改后的代码
def selective_scan_fn(u, delta, A, B, C, D=None, z=None, delta_bias=None, delta_softplus=False,
                     return_last_state=False):
    """if return_last_state is True, returns (out, last_state)
    last_state has shape (batch, dim, dstate). Note that the gradient of the last state is
    not considered in the backward pass.
    """
    return selective_scan_ref(u, delta, A, B, C, D, z, delta_bias, delta_softplus, return_last_state)

def mamba_inner_fn(
    xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,
    out_proj_weight, out_proj_bias,
    A, B=None, C=None, D=None, delta_bias=None, B_proj_bias=None,
    C_proj_bias=None, delta_softplus=True
):
    return mamba_inner_ref(xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,
                              out_proj_weight, out_proj_bias,
                              A, B, C, D, delta_bias, B_proj_bias, C_proj_bias, delta_softplus)

yolov8进行魔改

这里我参考别的博主进行复现魔改，发现根本跑不动，陷入死循环，下面是该播主给的backone以及MambaLayer

# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2      # 0.  320
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4     # 1.  160
  - [-1, 3, MambaLayer, [128]]                # 2.  160
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8     # 3.  80
  - [-1, 6, MambaLayer, [256]]                # 4.  80
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16    # 5.  40
  - [-1, 6, MambaLayer, [512]]                # 6.  40
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32   # 7.  20
  - [-1, 3, MambaLayer, [1024]]               # 8.  20
  - [-1, 1, SPPF, [1024, 5]]  # 9            # 9.  20

class MambaLayer(nn.Module):
    def __init__(self, dim, d_state=16, d_conv=4, expand=2):
        super().__init__()
        self.dim = dim
        self.norm = nn.LayerNorm(dim)
        self.mamba = Mamba(
            d_model=dim,  # Model dimension d_model
            d_state=d_state,  # SSM state expansion factor
            d_conv=d_conv,  # Local convolution width
            expand=expand,  # Block expansion factor
            bimamba_type="v2",
        )
 
    def forward(self, x):
        B, C = x.shape[:2]
 
 
        assert C == self.dim
        n_tokens = x.shape[2:].numel()
        img_dims = x.shape[2:]
        x_flat = x.reshape(B, C, n_tokens).transpose(-1, -2)
        x_norm = self.norm(x_flat)
 
        # x_norm = x_norm.to('cuda')
 
        x_mamba = self.mamba(x_norm)
 
        out = x_mamba.transpose(-1, -2).reshape(B, C, *img_dims)
        #out = out.to(x.device)
        return out**加粗样式**

然后我就按照他的进行复现，最后没能成功，感觉应该是我哪块有问题，然后我就将mamba直接和CBAM进行结合，效果好一点点吧，后面会进行更多的尝试。直接上我的代码

class MambaCBAM(nn.Module):
    # Convolutional Block Attention Module
    def __init__(self, c1, kernel_size=7, d_state=16, d_conv=4, expand=2):  # ch_in, kernels
        print(f"kernel_size = {kernel_size}")
        super().__init__()
        self.dim = c1
        self.channel_attention = ChannelAttention(c1)
        self.spatial_attention = SpatialAttention(kernel_size)
        # self.norm = nn.LayerNorm(self.dim)
        self.mamba = Mamba(
            d_model=self.dim,  # Model dimension d_model
            d_state=d_state,  # SSM state expansion factor
            d_conv=d_conv,  # Local convolution width
            expand=expand,  # Block expansion factor
            bimamba_type="v2",

        )

    def forward(self, x):
        # print(f"cbam x{x[0].size()}")
        cbma = self.spatial_attention(self.channel_attention(x))

        B, C = x.shape[:2]

        assert C == self.dim
        n_tokens = x.shape[2:].numel()  # 该行代码计算了输入张量x中获取了批量大小和通道数以外的所有维度的元素数量，即图像中的像素数或特征处理的长度。
        img_dims = x.shape[2:]  # 该行代码实现了输入张量x中获取批量大小和通道数除了所有维度的大小，即图像的高度和宽度。
        x_flat = x.reshape(B, C, n_tokens).transpose(-1, -2)
      
      
        if str(x.device) != 'cpu':
            x_mamba = self.mamba(x_flat)
         

        else:
            x_mamba = x_flat

      

        out= x_mamba.transpose(-1, -2).reshape(B, C, *img_dims)


        return out+cbma

锁我喉是吧

关注

28
点赞
踩
35

收藏

觉得还不错? 一键收藏
18
评论
mamba复现—mamba+yolov8魔改（win）

将Mamba结合到Yolov8架构中的方法，旨在展示其在目标检测任务中的潜力。通过结合Mamba的优势，Yolov8_MambaCBAM旨在改善长距离信息捕获和全局建模能力，以提高目标检测任务的性能...
复制链接

扫一扫

专栏目录