基于Transformer的端到端可变长度体数据分类

最新推荐文章于 2024-09-27 12:46:23 发布

小杨小杨1

最新推荐文章于 2024-09-27 12:46:23 发布

阅读量578

点赞数 7

分类专栏： # 全监督文章标签： transformer 分类深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45745941/article/details/138995289

版权

全监督专栏收录该内容

128 篇文章 4 订阅

订阅专栏

文章目录

Transformer-Based End-to-End Classification of Variable-Length Volumetric Data

Transformer-Based End-to-End Classification of Variable-Length Volumetric Data

摘要

在自动分类3D医学数据时，内存占用问题和样本切片数量的差异是两个主要挑战。传统的解决方案如子采样虽然能解决这些问题，但可能会丢失重要的诊断信息。Transformer在序列数据分析中显示了良好的性能，但其在处理长序列时，数据、计算和内存需求都非常高。本文提出了一种基于Transformer的端到端框架，能够高效分类可变长度的体数据。

输入数据随机化：
- 在训练过程中，通过随机化输入的体数据分辨率（即切片数量），增强了分配给每个体数据切片的可学习位置嵌入的能力。
- 这样做的目的是使每个位置嵌入中累积的位置信息能够泛化到相邻切片，甚至在测试时对高分辨率体数据也适用。
模型结构：
- 使用Transformer编码器对随机化后的体数据进行编码，从而捕捉数据中的全局和局部特征。
- 分类头部分基于编码器的输出进行分类，可以是全连接层或卷积层，具体取决于任务需求。
训练和推理：
- 通过在训练期间变化输入的体数据分辨率，使模型对可变体数据长度更具鲁棒性，并能适应不同的计算预算。

在视网膜OCT体数据分类任务中进行了评估。实验结果显示，本文提出的方法在9类诊断任务中的平衡准确率平均提高了21.96%，相对于最新的视频Transformer方法具有显著优势。我们的研究表明，在训练过程中变化输入的体数据分辨率，能够生成比使用固定切片数量训练时更具信息量的体数据表示。

本文提出的基于Transformer的端到端分类框架，能够高效处理可变长度的体数据，显著提高分类性能。这种方法不仅增强了模型对体数据长度变化的适应能力，也展示了其在实际医学图像分类任务中的广泛应用潜力。

模型代码和相关资源将在论文发布后提供，以供学术界和工业界进一步研究和应用。

方法

在这里插入图片描述
图1展示了本文提出的基于Transformer的3D体数据分类方法的整体结构。该方法通过共享的切片特征提取器（SFE）处理输入切片，并在每个epoch更新切片数量和位置嵌入（PEs）序列

实验结果

在这里插入图片描述

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小杨小杨1 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。