这是一篇针对医学CT图上的而非公共数据集上的语义分割,由题目也可以看出,采用了UNet型结构。
文章目录
概述
- 要解决的问题
- Liver cancer的CT图诊断
- 要解决的问题就是2D convolutions不能对CT图的三维信息很好的利用
- 如果是3D的卷积【各个框架都有实现】,会耗费很大的计算和内存资源
- 采用的方法
- 提出的bybrid densely connected Unet(H-DenseUnet), end-to-end
- 结果如何
- 在数据集MICCAI 2017 Liver Tumor Segmentation(LiTS) Challenge 和 3DIRCADb数据集上进行评估,比其他state-of-the-art效果好。
- 2017LiTS leaderboard第一名,3DIRCADb数据集上结果为state-of-the-art。
- Contributions
- 在特定的方向上提出了的方法。提出了针一种针对性的CT立体图问题解决方法。
- Related work:
- 相比于肝(liver)分割,肝肿瘤(liver tumor)分割更加具有挑战性:(1) 肝瘤在不同的病人身体有不同的size, shape,位置,数量。这些问题严重阻碍自动分割;(2) 一些病变没有明显的边界;(3) 许多CT扫描由各向异性尺寸组成,沿z轴变化较大(体素间距在0.45mm至6.0mm之间),这对自动分割方法提出了挑战。【有点不太透彻】
- 现在的3D与训练模型很少,几乎没有,知识迁移无法做到。
- 【以下是一些综述】
- 过去的几十年里,有些多的算法去做肝和肝瘤的图像分割,包括:(1)基于手动设计特征的方法:thresholding, region growing, deformable model based methods and machine learning based methods。(2)基于深度学习的方法
细节
-
由三部分组成:2D DenseUnet,3D DenseUnet,HFF(hybrid feature fusion)
-
Deep 2D DenseUnet for Intra-slice Feature Extraction:
- 2D模块为DenseNet-161,如上图第一个蓝块,输入为2D图像( w ∗ h ∗ 1 {w*h*1} w∗h∗1)【这里的二维是指视觉上的,而不是指其具体维度】,具体的DenseNet在图©中显示,在一个Dense block中,每经过一个层后,channels数会增加k(k为growth rate)。
- 最原始的训练样本的维度是: I m a g e ∈ R n ∗ 224 ∗ 224 ∗ 12 ∗ 1 {Image \in R^{n*224*224*12*1}} Image∈Rn∗224∗224∗12∗1,其实就是一个立体三维的图像,标签则是 Y ∈ R n ∗ 224 ∗ 224 ∗ 12 ∗ 1 {Y \in R^{n*224*224*12*1}} Y∈R