SwinMM: Masked Multi-view with Swin Transformers for 3D Medical Image Segmentation

最新推荐文章于 2024-08-23 22:07:50 发布

小杨小杨1

最新推荐文章于 2024-08-23 22:07:50 发布

阅读量437

点赞数 9

分类专栏：分割文章标签：学习计算机视觉人工智能深度学习论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45745941/article/details/138561307

版权

分割专栏收录该内容

39 篇文章 4 订阅

订阅专栏

文章目录

SwinMM: Masked Multi-view with Swin Transformers for 3D Medical Image Segmentation

SwinMM: Masked Multi-view with Swin Transformers for 3D Medical Image Segmentation

摘要

最近，在大规模视觉Transformer方面取得的进展显著改进了医学图像分割的预训练模型。然而，这些方法面临着一个明显的挑战，即获取大量的预训练数据，特别是在医学领域。为了解决这一限制，研究人员提出了一种新的多视图方法，名为Masked Multiview with Swin Transformers（SwinMM），用于实现准确和高效的自监督医学图像分析。

该策略利用了多视图信息的潜力，包括两个主要组成部分。在预训练阶段，他们部署了一个被mask的多视图编码器，通过一系列多样的代理任务同时训练掩蔽的多视图观测。这些任务涵盖了图像重建、旋转、对比学习，以及一种利用相互学习范式的新任务。这项新任务利用了不同视角预测之间的一致性，从3D医学数据中提取隐藏的多视图信息。在微调阶段，他们开发了一个跨视图解码器，通过交叉注意力块聚合多视图信息。与先前的最先进的自监督学习方法Swin UNETR相比，SwinMM在多个医学图像分割任务上展现出显著优势。它允许平滑地整合多视图信息，显著提升了模型的准确性和数据效率。
代码地址

方法

图1. SwinMM的概述。Conv-Blocks对从掩蔽的多视图编码器的不同级别获得的潜在表示进行卷积，使它们的特征大小与相应的解码器层匹配。Up-Blocks执行反卷积以上采样特征图。
在这里插入图片描述

实验结果

在这里插入图片描述

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
SwinMM: Masked Multi-view with Swin Transformers for 3D Medical Image Segmentation

最近，在大规模视觉Transformer方面取得的进展显著改进了医学图像分割的预训练模型。然而，这些方法面临着一个明显的挑战，即获取大量的预训练数据，特别是在医学领域。为了解决这一限制，研究人员提出了一种新的多视图方法，名为Masked Multiview with Swin Transformers（SwinMM），用于实现准确和高效的自监督医学图像分析。该策略利用了多视图信息的潜力，包括两个主要组成部分。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小杨小杨1 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。