生物医学图像分割是许多医学应用中的重要任务。基于卷积神经网络的分割方法虽然精确度达到了state-of-the-art,但是通常需要依赖于带有大型标注数据集的监督训练。医学图像的标注需要大量的专业知识和时间,并且在大规模上是不可行的。为了解决缺乏标注数据的问题,研究人员通常使用人工预处理、手动调整架构和数据增强等技术。然而,这些技术涉及复杂的工程工作,并且通常针对特定的数据集。因此MIT的团队提出了用于医学图像的自动数据增强方法。

  在one-shot磁共振成像(MRI)脑部分割这一实际挑战中,MIT团队提出的半监督方法只需要单个有人工标注的数据以及其他没有标注的数据。首先从图像中学习变换模型,通过该模型及已标注样例再来合成额外的标注样例进行训练。每个变换由空间变形场(spatial deformation field)和强度(intensity)变化组成,能够合成复杂的效果,例如解剖学和图像采集程序的变化。通过这些新样例增强有监督分割模型的训练,相较于one-shot生物医学图像分割的state-of-the-art方法有了显著的改进。

  医学图像数据集的挑战

  图像语义分割对于许多生物医学成像应用至关重要,例如进行人口分析,疾病诊断和治疗规划等。当有足够的标注数据时,有监督的基于深度学习的分割方法可以产生最精确的结果。然而,在医学图像数据集方面具有很大挑战。

  1、人类大脑存在大量的解剖变异

  2、手动分割标签需要相当多的专业知识和时间,大多数临床图像数据集手动标注的图像非常少

  3、不同机构和机器的图像采集差异,导致数据分辨率,图像噪声和组织外观等方面产生很大的差异

  

CVPR最新医学影像AI论文:利用学习图像变换进行数据增强


  图1:生物医学图像在解剖结构,对比度和纹理方面经常变化很大(顶行)。与其它one-shot分割方法(底行)相比,我们的方法能够更准确地分割解剖结构。

  为了克服这些挑战,许多有监督的生物医学分割方法专注于人工设计预处理步骤和架构。使用手动调整的数据增强来增加训练样本的数量也很常见,诸如随机图像旋转或随机非线性变形之类的数据增强功能,并且已被证明在某些例子中有效地提高了分割准确度。然而,这些功能模拟多样化和现实的例子的能力有限,并且可能对参数的选择高度敏感。

  因此,MIT团队建议通过学习合成多样且真实的标注样例来解决标注数据数量有限的挑战。总的流程如图2所示。为了执行数据增强,我们将变换τ(k)应用于标记的图谱(atlas) x。我们首先学习单独的空间和外观变换模型,以捕获标记的图谱和每个未标记的体积之间的解剖和外观差异的分布。使用两个