文章目录
PHTrans: Parallelly Aggregating Global and Local Representations for Medical Image Segmentation
摘要
- 本文提出了一种新的混合医学图像分割架构PHTrans,它在主要构建块中并行混合Transformer和CNN,从全局和局部特征中产生分层表示,并自适应地聚合它们,旨在充分利用它们的优势,获得更好的分割性能。
- PHTrans遵循了U形编码器-解码器的设计,并在深层阶段引入了并行hybird模块,其中卷积块和修改的3D Swin Transformer分别学习局部特征和全局依赖性,然后序列到体积的操作统一了输出的维度,以实现特征聚合。
代码地址
本文方法
PHTrans体系结构概述如图2(a)所示。PHTrans遵循U型编码器和解码器的设计,主要由纯卷积模块和并行混合模块组成。我们的初衷是构建一个由Transformer和CNN组成的完全混合架构,但由于自注意机制的高计算复杂性,Transformer无法直接接收像素作为令牌的输入。在我们的实现中,引入了卷积块和下采样操作的级联,以减少空间大小,从而逐步提取低级具有高分辨率的特征,以获得精细的空间信息。类似地,这些纯卷积模块在同一阶段部署在解码器中,以通过上采样恢复原始图像维度。
详细可以去看代码
实验结果