论文分享 Learning tree-structured representation for 3D coronary artery segmentation

Learning tree-structured representation for 3D coronary artery segmentation(2019.8)

摘要

冠状动脉的分割已经进行了广泛的研究,然而,由于其复杂的解剖结构,从三维冠状动脉ct血管造影(CCTA)中自动分割冠状动脉具有极大的挑战性。受近年来利用树状结构的长短期记忆(LSTM)来模拟具有树状结构的NLP任务的启发,我们提出了一种新的树状结构卷积门控递归单元(ConvGRU)模型来学习冠状动脉的解剖结构。然而,与针对自然语言处理中的语义关联和情感分类而提出的树结构LSTM不同,我们的树结构ConvGRU模型考虑了输入数据中的局部空间相关性,因为卷积适用于输入到端以及端到端的转换,因此更适合于图像分析。为了进行体素分割,我们提出了一种树状结构的分割框架。它由用于多尺度不同特征的提取和最终预测的全卷积网络(FCN),以及用于解剖结构建模的树状ConvGRU层组成。在四个大规模的三维CCTA数据集(据我们所知是最大的)上对所提出的框架进行了广泛的评估,实验表明,与其他冠状动脉分割方法相比,我们的方法更加准确和有效。

相关工作

1. Vessel segmentation

第一类方法需要在起点和终点之间建立一条最小成本路径,这是手动或自动预定义的( 3d MRA
coronary axis determination using a minimum cost path approach)。得益于利用更高层次的信息,它们往往会产生更符合解剖学的结果。然而,准确分割冠状动脉需要一个精心设计的成本函数来控制分割过程的迭代。

第二类方法的基本策略是产生一个预分割,然后恢复缺失的结构并去除假阳性分割( Automatic centerline extraction of coronary arteries in coronary computed tomographic angiography)。然而,它们需要相对准确的预分割来初始化细化过程。

第三类方法通过跟踪来实现血管的分割。他们反复决定下一个位置和血管的几何结构(如方位和半径)。这将显著降低计算成本,因为只需要探索图像体积的一小部分。不幸的是,这些技术对噪音、伪影和其他局部扰动也很敏感,因为它们只依赖于局部信息。
在这里插入图片描述
图1. 从左到右:三维CCTA容积,相应的冠状动脉分段,以及冠状动脉的三个纵向视图。冠状动脉分段用红色表示。

2. Convolutional RNN models

到目前为止,过去的研究大多使用长短期记忆(LSTM)来处理梯度消失或爆炸的臭名昭著的问题,这是训练普通RNN模型时的一个重要问题。通过合并几个精心设计的门函数,LSTM减轻了这个问题。然而,输入到端和端到端的变化是基于LSTM中的完全连接层,忽略了输入数据中的局部空间相关性,因此,它不适合于图像序列的分析。最新提出的卷积LSTM(convlstm)用卷积运算代替了LSTM中的矢量乘法,它保留了输入的空间拓扑结构,同时在LSTM中引入稀疏性和局部性,以减少过参数化和过拟合。不幸的是,具有高度分支化和管状结构的血管是极其复杂的,而最初设计用于图像序列分析的convlstm不能处理这种复杂的树结构。虽然树结构LSTM被提出用于分析树结构数据(特别是在自然语言处理中的语义关联和情感分类),但是树结构LSTM单元中使用的向量乘法不适合于图像分析。相反,我们的树结构ConvGRU设计解决了这两个问题,即没有考虑复杂的树结构和输入数据中的局部空间相关性(图2)。

Methodology

1.1 LSTM & GRU

在这里插入图片描述
在这里插入图片描述

1.2 ConvLSTM

在这里插入图片描述

2. Tree-structured ConvGRU

Sequential ConvRNNs无法处理树状结构的数据。为此,我们提出了一种新的树状结构的ConvRNN网络来提取树状结构的解剖学信息,其中父节点从其所有子节点选择性地聚集特征。例如,希望强调当存在较细动脉与主干动脉合并时,主动脉的几何结构和方向。

在这里插入图片描述
图2. 从左至右:sequential ConvLSTM和提出的树结构ConvGRU。在ConvLSTM中,包括输入Xt、先前隐藏状态Ht-1和先前存储器Ct-1的信息按顺序传递(从t-1到t,然后到t+1)。与树结构的ConvGRU一样,它没有内存单元。信息从所有子节点传递到父节点。例如,此图中的节点j合并信息(来自其子节点l1和l2以及当前输入Xj的隐藏状态hl1和hl2)以生成当前隐藏状态Hj。节点k合并信息(来自其子j的隐藏状态hj及其输入Xk)以生成当前隐藏状态Hk。注意,尽管我们只显示树结构ConvGRU模型的一个或两个子节点,但它能够处理两个以上的子节点。

3. Artery centerline extraction

首先,我们从CCTA数据中提取冠状动脉中心线,它捕获冠状动脉的解剖结构。我们使用先前公布的方法(DeepCenterline)提取中心线。它是一种基于深度学习的方法,能够产生精确的(误差在单个体素内)中心线。这里总结了简短的流程。

  • 我们使用3D U-Net预分割冠状动脉。解剖结构是通过预分割获得的。尽管如此,仍然存在许多错误的预测。由于所提出的树型结构分割框架对不完全分割具有较强的抵抗力,因此本研究不需要精确的预分割。
  • 我们使用之前发表的基于深度学习的方法(DeepCenterline)进行中心线提取。更具体地说,通过训练的多任务FCN网络同时预测中心线的端点和距离图。
  • 最终的动脉中心线由最小路径算法生成。生成的中心线可以用树结构G=(V,E)表示,其中节点(表示中心线点)和邻接矩阵(表示中心线点之间的连接)分别用V和E表示。

4. Tree-structured segmentation network architecture

本文将冠状动脉分割问题描述为一个树状结构的分割问题,其中训练集是冠状动脉树的集合,预测值也被构建成树状结构。此工作中的输入树如下所示。对于动脉树G中的每个节点j,从中心线垂直方向的CCTA体积裁剪横断面图,我们进一步用主动脉强度和钙化阈值分别使这个小斑块标准化,以突出这两个重要区域。最后,将标准化的切片与原始切片连接起来,结果是一个与节点j相关联的树状通道图像xj。形式上,目标是学习一个非线性函数 ( H 1 , . . , H J ) = σ W ( x 1 , . . . , x J ) (H_1,.. ,H_J)=\sigma_W(x_1,... ,x_J) H1..HJ=σWx1...xJ,将树状结构输入映射到树状结构输出,其中J和W表示树中的节点数和要学习的参数。图3示出了所提出的树结构分割框架的概述。

在我们的网络中,我们将结构化信息建立在一个统一的神经网络中,该网络可以端到端地进行训练。它有三个模块:编码器、树结构的ConvGRU和解码器。编码器 ϕ \phi ϕ从输入数据中提取鉴别特征,得到每个节点j的多尺度表示xj。树结构ConvGRU模块 ψ \psi ψ建模冠状动脉的解剖结构,生成特征图Hj,编码新提取的解剖相关特征。基于由编码器和树结构ConvGRU生成的特征映射,解码器 φ \varphi φ生成最终预测Pj。

在这里插入图片描述
图3. 对提出的树结构分割网络进行了综述。系统的输入是一个输入树V,即图像组织为树结构。输出P也被组织为树结构。树形分割网络由两部分组成:带编码器的FCN主干网 ϕ \phi ϕ用于判别特征学习和用于预测的解码器 φ \varphi φ,以及用于解剖结构建模的树结构ConvGRU层 ψ \psi ψ。FCN骨干网络和树结构的ConvGRU层由所有树节点共享。详细信息如图4所示。

4.1 Discriminative feature learning & tree-structured output generation

图4示出了用于特征提取和最终预测的骨干网络。它基于U-Net(Ronneberger等人,2015)架构。编码器,解码器将整个分割过程分为三个阶段:鉴别特征学习、解剖结构建模和树结构输出生成。

说明是用的2D U-Net

在鉴别特征学习阶段,输入与每个节点j相关联的图像xj进入编码器,其中包括几个3×3卷积层(每个卷积层后面跟着一个ReLU层)。两个2×2层也被用来对特征地图进行下采样。编码器能够从输入中提取鉴别特征 χ j = ϕ ( x j ) \chi_j=\phi(x_j) χj=ϕ(xj)。在解剖结构建模阶段之后,由树状结构的ConvGRU层生成隐藏状态Hj,解码器使用反卷积逐步将特征映射重新缩放到原始维度,同时合并从编码器传递的信息,得出最终预测Pj= φ \varphi φ(Xj,Hj)。编码器和解码器的细节如图4所示。
在这里插入图片描述
图4. 详细介绍了提出的树型分割网络。编码器和解码器都由多个卷积层组成(每个卷积层后面跟着一个ReLU层,为了简单起见,该层被忽略)。对于与节点j相关联的输入图像Xj,它被传递到多个卷积层中,并由编码器中的池层逐步降采样,生成特征映射Xj。树结构的ConvGRU层接受输入Xj并生成隐藏状态Hj。在解码器中,来自树结构ConvGRU层的Hj逐渐向上采样到原始维度,同时合并来自编码器的信息,产生最终的预测Pj。

4.2 Anatomical structure modeling

树状结构ConvGRU的引入是由于冠状动脉树状结构中存在固有的解剖结构。例如,肾小管动脉由近端向远端逐渐变化,各节段的伸长和半径变化平稳。在我们的系统中使用树结构的ConvGRU有两个好处。首先,通过将编码器提取的特征反馈给树结构的ConvGRU,在树节点之间传播上下文信息。因此,最终的编码器不仅可以根据一个节点的特征进行预测,而且还可以考虑到沿冠状动脉树的拓扑变化。其次,如第3.2节所述,每个树节点可能存在多个分支,在这些特殊的位置,我们的系统能够对这些转换进行建模。树结构的ConvGRU层接受输入Xj并生成隐藏状态 H j = ψ ( χ j ) H_j=\psi(\chi_j) Hj=ψ(χj)

4.3 Loss function

即所有节点的平均Dice系数

在这里插入图片描述

Experiments

我们收集了四家医院的四个大数据集(共916次CT扫描)。这些合作医院是从不同地区挑选出来的,代表着医疗环境的多样性。80%、5%和15%的扫描分别用于训练、验证和测试。
在这里插入图片描述
在这里插入图片描述

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
### 回答1: ConvGRU和ConvLSTM都是基于循环神经网络(RNN)的变种,用于处理序列数据。它们的主要区别在于内部结构和门控机制。 ConvGRU(Convolutional Gated Recurrent Unit)是一种具有门控机制的RNN变体,它使用重置门和更新门来控制信息的流动。ConvGRU的内部结构类似于GRU,但是它使用了卷积操作来处理输入序列,使其更适合处理像图像这样的结构化数据。ConvGRU的门控机制可以控制信息的流动,以便在处理长序列数据时避免梯度消失或梯度爆炸问题。 ConvLSTM(Convolutional Long Short-Term Memory)是一种具有门控机制的RNN变体,它使用输入门、遗忘门和输出门来控制信息的流动。ConvLSTM的内部结构类似于LSTM,但是它也使用了卷积操作来处理输入序列。ConvLSTM的门控机制可以在处理长序列数据时记忆重要信息并遗忘不重要信息。 总体来说,ConvGRU和ConvLSTM都是用于处理序列数据的强大工具,但是它们的内部结构和门控机制略有不同,因此在不同的应用场景下可能会有不同的表现。 ### 回答2: ConvGRU和ConvLSTM是两种常用的基于卷积神经网络的循环神经网络结构,主要用于处理序列数据。 首先,ConvLSTM是由普通LSTM结构进行改进而来的,加入了卷积操作。ConvLSTM在长短时记忆网络中引入了一系列卷积运算操作,以提取输入序列中的空间信息。通过卷积操作,ConvLSTM可以对序列中的空间特征进行建模,对于处理具有时空相关性的序列数据具有较好的效果。实际上,ConvLSTM在处理视频、图像等二维或者三维序列数据时非常有效。 而ConvGRU是对普通GRU(门控循环单元)进行改进后的结构,引入了卷积操作。ConvGRU也可以有效地对序列数据进行建模,并且具有更少的参数个数。与ConvLSTM类似,ConvGRU在处理二维或者三维序列数据时效果较好。 除了在处理空间特征上的差异外,ConvLSTM和ConvGRU在实际应用中还有一些其他的区别。ConvLSTM通常具有更多的门控单元,这使得ConvLSTM可以更好地捕捉输入序列中的长期依赖关系。然而,这也导致ConvLSTM在训练和推理过程中相对较慢、计算复杂。 相比之下,ConvGRU具有较少的门控单元,因此计算量较小,速度较快。ConvGRU更适用于处理那些相对较短的序列或者需要快速处理的场景。ConvGRU在语音识别、文本生成等领域中应用广泛。 综上所述,ConvLSTM和ConvGRU在处理序列数据时都能有效地建模空间特征,但ConvLSTM适用于长期依赖关系的捕捉,ConvGRU则更适用于速度要求较高的场景。在具体应用中,选择哪种结构要根据需求和实际情况进行判断。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值