IVP 2021 UNETR: Transformers for 3D Medical Image Segmentation

动机
  1. 具有跟踪和扩展路径的全卷积神经网络(FCNNs)(如编码器和解码器),近年来在各种医学图像分割应用中显示出了突出的地位。在这些体系结构中,编码器通过学习全局上下文表示来扮演一个不可或缺的角色,该全局上下文表示将进一步用于解码器的语义输出预测。
  2. 卷积层作为FCNN的主要构造块,其局部性限制了此类网络学习长时空间依赖的能力。
  3. 在NLP领域,基于transformer的模型已经在各种任务中实现了最先进的基准。transformer中的自我注意机制使他们能够动态地突出词序列的重要特征并学习其长时依赖关系。这一概念最近被扩展到计算机视觉,引入了视觉transformer(ViT)。在ViT中,一张图像被表示为将用于直接预测用于图像分类的类标签的图片块嵌入序列。
方法

在这里插入图片描述

如上图所示,UNETR采用收缩-膨胀模式,由一堆transformer作为编码器,通过跳过连接与解码器相连。

编码器。创建一个三维输入(h×W×D×C)的一维序列,通过将其划分为flatten的相同大小的非重叠图片块。使用一个线性层将平面化的图片块投影到一个K维嵌入空间中,该空间在整个transformer中保持不变。此外,为了保留所提取的图片块的空间信息,在投影图片块上加入一个一维可学习的位置

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值