3D Deep Leaky Noisy-or Network 论文阅读

最新推荐文章于 2023-02-06 13:56:50 发布

RookieFCB

最新推荐文章于 2023-02-06 13:56:50 发布

阅读量3.2k

点赞数 1

分类专栏：巨人的肩膀文章标签：深度学习卷积神经网络影像组学

本文链接：https://blog.csdn.net/u013058162/article/details/80470426

版权

巨人的肩膀专栏收录该内容

9 篇文章

订阅专栏

3D Deep Leaky Noisy-or Network 论文阅读

原文：Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network

博文参考：Doublle Tree的博客中Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network 论文阅读一文。

注：本文为2017年Kaggle举办的数据科学竞赛中，第一名获奖团队的相关论文，若需查看代码可访问Github。

简介

根据CT图像的肺癌自动诊断系统包含以下步骤：

检测所有可疑病变；
评估整个肺部的恶性程度。

但目前大多数的研究主要集中于第一步，以及通过肺结节诊断肺癌存在较高的假阳性率。因此，肺癌的诊断需要对每个可疑结节进行细致分析，再联合所有结节信息进行定性诊断。针对上述问题，本文提出了一个三维深度神经网络（3D deep neural network）用于解决这些问题。该网络由两部分组成：

用于结节检测的3D region proposal network；
基于置信检测（the detection confidence）选出top-5结节并评估其癌症可能性，最后将此概率与Leaky noisy-or模型相结合评估患者患癌的可能性。

其中，上述两个模型均采用修改后的U-net模型，并使用数据增强操作避免过拟合问题。

数据集和预处理

数据集

训练集由LUNA16数据集（the Lung Nodule Analysis 2016）和NDSB3（Data Science Bowl 2017）数据集两部分组成。其中，LUNA16数据集含有888个病例，标记了1186个肺结节；在NDSB3数据集中，1397个病例用于训练，198个病例用于验证，506个病例用于测试，且人工标注了训练集中754个结节和验证集中78个结节。

对于LUNA16数据集，其存在许多较小的注释结节，且临床经验认为直径6mm以下的肺结节无危险。但在NDSB3数据集中，存在较多的大直径结节且结节多与主支气管相连。因此，针对两个数据集的差异，需去除LUNA16数据集中直径6mm的结节，同时对NDSB3数据集进行人工标注。

此处说明了Julian de Wit的解决方案中，直接设置结节直径为6mm的原因，以及为何需对NDSB3数据集进行人工标注。

image_1cdh21aa1402v6unub1jcj1pvh9.png-41.3kB

上图为结节分布情况图。其中，图a为DSB（NDSB3）与LUNA（LUNA16）数据集中结节直径分布情况；图b为DSB数据集中患癌患者与健康人群的最大结节直径分布情况。

预处理

首先将所有的原始数据转变为HU值，如下图a所示，再进行如下步骤：

Screenshot from 2018-05-15 13:41:24.png-65.1kB

掩膜提取：在2D切片上，首先使用标准差为1的高斯滤波和阈值为-600的处理得到肺部以及周围较暗部分的掩膜，如上图b所示，然后进行连通性分析去除小于 $30mm^2$ 的connected component和离心率大于0.99的部分（some high-luminance radial imaging noise），再计算得到二值的3D矩阵中所有的3D connected component，且仅保留非边缘部分（用于去除肺部周围较暗的部分）以及体积在0.68~7.5L之间的部分，结果如上图c所示；
凸包与扩张：若结节与肺的外壁相连，则其将不会出现在上述提取的掩膜中。因此，对于这种情况，首先将肺部分为左右两个部分，即左肺与右肺，如上图d所示。然后分别对左右肺进行凸包处理，并向外扩张10像素，如上图f所示。但对于一些2D切片而言，肺部的底部类似与月牙形，如下图所示。若对于该类型进行凸包处理后，面积大于初始的1.5倍，则放弃凸包，从而避免引入过多的其他组织；
灰度标准化：将HU值（[-1200, 600]）线性变换至0~255内的灰度值，且掩膜以外的像素灰度值均设为170，以及扩张区域内的像素灰度值高于210则也设为170。

用于结节检测的3D卷积神经网络

该网络是基于U-net的3D版RPN（Region Proposal Network）模型。

输入数据

受限于显存，输入数据大小为 $128 \times 128 \times 128 \times 1 （ H e i g h t \times L e n g t h \times W i d t h \times C h a n n e l ）$ ，并随机选择两种patch：一种为70%的输入数据至少包含一个结节；另一种为30%的输入数据不含结节。其中，patch超出图像部分用灰度值为170填充。

为了避免过拟合问题，数据采用数据增强方法。

此处可根据实际情况将输入数据大小调整为64或者32。

网络结构

网络由前馈路径和反馈路径组成，如下图图a所示。

image_1ce37f9qh1aabrhk1qp174g19v49.png-143.2kB

前馈路径

以两层卷积核为 $3 \times 3 \times 3$ 的卷积（channel为24）开始，且padding为1；其后为4个残差块，其中每个残差块由3个残差单元组成（如上图图b所示），而每个残差单元由卷积、Batch Norm、ReLU激活函数、卷积和Batch Norm组成，且卷积核大小均为 $3 \times 3 \times 3$ 。除此之外，每个残差块均有一个最大池化层，大小为 $2 \times 2 \times 2$ ，步长为2。

反馈路径

反馈路径由两层反卷积（装置卷积）层和两个融合单元构成。最后，由卷积核均为 $1 \times 1 \times 1$ 且channel为64和15的两层卷积层将数据大小转换为 $32 \times 32 \times 32 \times 15$ 。

反卷积层

卷积核大小为2，步长为2。

注意该部分的代码实现部分，原始U-net网络设置为不可学习。

融合单元

每个融合单元（如上图图c所示）均由一个前馈blob和反馈blob组成，其结果作为残差块的输入。

值得注意的一点，本文作者在此处引入了位置信息，作为额外的输入数据。

位置信息

proposal的位置信息可能影响是否为结节和是否为恶性的判断，因而引入位置信息。

具体方法：对于每个patch，计算其相对位置坐标，并将其大小转换为 $32 \times 32 \times 32 \times 3$ 。

其中，位置坐标对应归一化后的X，Y和Z轴（每个轴的取值范围为-1～1，对应于肺的两端）。

输出层

输出数据为4D的tensor， $32 \times 32 \times 32 \times 3 \times 5$ ，其中3表示anchor个数，5表示回归量（ $\hat{o}, \hat{d_x}, \hat{d_y}, \hat{d_z}, \hat{d_r}$ ，即概率，三维坐标和bounding box直径大小）。