Large Window-based Mamba UNet for Medical Image Segmentation: Beyond Convolution and Self-attention

摘要:

分割 组织的轮 几年中 积神 (cnn) transformer 了主 但它们仍 感受野或昂贵的长程建模 模型(State Space Sequence Model Mamba) 线性复杂度的长程依赖 Mamba (LMa-UNet), 2D 和和和 3D 分割 LMa-UNet 一个 用了大cnntransformer部空间全局建 设计 了一 向的MambaMamba
使 大感受

一、Introduce

目前研究:

  1. 动分割骨干,积神(cnn)transformer了人会招致
  2. cnn(UNet)通常寻出色,无效。
  3. 近有研究往往理时间构。
  4. transformer牺牲了一个二次token而牺牲分信息。许多研究表明,transformer在7 × 7窗口大小上实现了最佳权衡,因为较小的窗口会导致更多的计算,而较大的窗口会导致性能的显著下降。
  5. CNN-Transformer建模方局图像交互的问题

SSMs

  • (SSMs) (Mamba)为一强大的
  • 线依赖的
  • ssm使()中的每与任交互地将二线
  • 设计 ssm 为了 (NLP) ,但也 视觉 分割 U-Mamba和segamba SSM-CNN Mamba 效地建
Mamba潜 挖掘 决:
  1. 线Mamba与之MambaMamba
  2. Mamba 缺乏位
  3. Mamba 为一 出的, 视觉 素的不 Mamba

(LMa-UNet)

  1. 了一Mamba UNet (Large window-based Mamba UNet, LMa-UNet)2D/3D分割
  2. Mamba线杂度,通过为SSM模块分配大窗口来实现大的感受野。进一步,设计了一种新的基于层次和双向大窗口的Mamba块(LM块),以增强ssm的表示建模能力。
  3. Mamba 设计 进行位
  4. Mamba 设计 两类SSM :(i) SSM (PiM) (ii) patch SSM (PaM) PiM 窗口SSM SSM
    PaM 交互

 主要贡献:

  • 了一Mamba UNet (Large window-based Mamba UNet, LMa-UNet)2D/3D分割
  • 将大感SSM使
  • 设计了一基于位Mamba
  • 了一SSM (PiM)和SSM (PaM)Mamba部邻模和长

二、:SSM

ssm (structured state space sequence models, S4)和 Mamba 都是从连续系统演化而来的,该连续系统将一个一维函数或序列 x ( t ) y ( t ) ∈ R映射到一个隐藏状态 。这个 为下 线 :
公式(1)

其中:

  • 是状态矩阵
  • 是投影参数
S4 Mamba 述连 将连续 A , B 散参数 。通常 零阶 (zero-order hold,ZOH)作 :
公式(2)

A, B,公式一(1)(SSM): 

公式(3)

 :

公式(4)

  • Lx,
  • 是结构化卷 

三、方法

3.1 LMa-UNet

LMa-UNet1示: 

图1 LMa-UNet 结构图
编码器 跳跃 UNet LMa-UNet 过在编 (LM) UNet 一个分 C × D × H × W 3D 为特征图  。然 F 0 LM 层中, ; 一个 LM 两个 Mamba : SSM (PiM) 块级SSM (PaM)。对于 l^{th} 层,该过 :
公式(5)

中:

  • PiMPaM分别SSMSSM
  • Down-sampling表 
F_{l+1} 编码为 ;其中 表示特征图 F_{l}的通道和分辨率。在解码器部分,采用UNet解码器和带有跳跃连接的残差块进行上采样并预测最终的分割掩码。

3.2 LM块

LM 的空间 与以 CNN Transformer 依赖建 Mamba 线 LM 建模 许设 这将提 2(a) LM 一个 设计 由像素 SSM (PiM) SSM (PaM) ; 部邻 用于全 LM Mamba 感知序
图2 (a) CNN、Transformer 和我们提出的 LMa-UNet 之间的视野比较。CNN 通常使用小内核(如 3 × 3),Transformers 通常使用 7 × 7 大小的窗口。(b) vanilla Mamba 与我们提出的双向 Mamba 的扫描顺序比较。

1、像素SSM (PiM) :

Mamba 部相邻 的相 SSM 分割 多个大 SSM 划分 为互不重 2D 3D ; 2D H × W 将特 划分 m × n ( m n 40) 为了不失 H/m W/n 整数 HW/ mn 1 的像素 SSM Mamba 像素将 SSM; 部邻 在大窗 划分 使 然而, 划分 为不 窗口之
2、补SSM (PaM):
SSM 1 的补丁 SSM H × W F_{l}^{'} m × n ,以允 HW/ mn将子 个代 映射Z_{l} HW/ mn Mamba 通信。在Mamba中的交互之后,将聚合映射解池回初始特征映射 F_{l}^{'}的相同 大小 并应 接,公式 (5)中 的过程 :
公式(6)
中:
  • PoolingUnpooling分别
  • Bi-MambaMamba

3、Bidirectional Mamba (BiM):

SSM Mamba 块不同 LM SSM ( PiM PaM) 2 (b) 了差异 (Mamba) 为一个 一些 较早输 扫描方 Mamba 多的器 向和后向 了一 双向Mamba 细结 1 BiM 两个 可以更 区域。 和相对 ;

四、实验

4.1数据集

2D 3D 分割 两个 上与 验证LMa-UNet
CT CT 一个 3D 分割 MICCAI 2022 FLARE Challenge [16]的 100 CT 13 ( 胰腺、 上腺和 ) CT 40 × 224 × 192 MSD 集的50 自腹腔 50 于测试
腹部 MR。Abdomen MR 是一个公开可用的 2D 分割数据集,包含来自 MICCAI 2022 AMOS Challenge [11] 的 110 个 MRI 病例,包括 13 种腹部器官(与腹部 CT 数据集相同)。2D MRI 图像的大小为 320 × 320。60 个带注释的案例用于训练,另外 50 个案例用于测试。

4.2实现

我们的 LMa-UNet 基于 nnU-Net 框架在 PyTorch 1.9.0 上实现。所有实验均在 NVIDIA GeForce RTX 3090 GPU 上进行。3D 数据集(Abdomen CT)的训练批量大小为 2,2D 数据集(Abdomen MR)的批量大小为 24。使用动量 = 0.99 的 Adam [12] 优化器。初始学习率为 0.01,权重衰减为 3e-5。最大训练 epoch 数为 1000。对于Abdomen CT 数据集,阶段为 6,但维度不一致;因此,我们将每个阶段的矩形窗口大小设置为 [20, 28, 24]、[20, 28, 24]、[10, 14, 12]、[10, 14, 12]、[5, 7, 6] 和 [5, 7, 6]。对于 Abdomen MR 数据集,阶段为 7,每个阶段窗口大小为 40、20、10、10、5 和 5。

4.3综合性能

线 分割 : cnn (nnU-Net和 SegResNet) transformer (UNETR, SwinUNETR nnFormer), mamba (U-Mamba [15]) 为了 还在nnU-Net 使 1 结果。 cnn transformer 分割 LMa-UNet 以下 方面取 DSC NSD Mamba 分割至 U-Mamba U-Mamba Mamba 建模适 LMa-UNet U-Mamba 向和 Mamba 设计的 Mamba 在基 特征建

4.4LMa-UNet 

Mamba 线 LMa-UNet cnn transformer 大窗口 为了 Mamba LMa-UNet 窗口大小设置下的性能。表2显示了腹部MR数据集的结果,该数据集的分期为7。比较三种窗口大小设置的性能,可以发现窗口大小较大的LMa-UNet具有更好的性能。这表明大感受野对于医学图像分割是至关重要的,而由于Mamba的线性复杂性,它可以实现医学图像分割。这将为未来的大型内核或窗口建模提供更多可能性。

4.5消融实验

为了 LMa-UNet MR 实验。 3 PiM PaM LMa-UNet 优于基 线 分别 PiM PaM 效性。 PiM PaM 部特征 BiM LMa-UNet 一步提 Mamba 件的LMa-UNet 成部分

 五、结论

了一 mamba UNet 分割 建模。 为了 Mamba 设计 了一 分层SSM 分割 验验 未来, SSMs 配准、
  • 36
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值