这篇论文主要针对两个问题:
①现有的大部分评测模型性能的方法都是基于随机划分数据集的方式,忽视了训练集和测试集中出现同一个病人图像的可能性
②现有的大部分模型都没有明确考虑病变部位的空间信息和利用高分辨率的图像
针对上述问题,作者提出了一个局部位置感知网络(DNetLoc),即考虑了高分辨率的图像数据,也考虑了病变部位的空间信息
(1)数据集
作者采用了两个数据集,第一个是 ChestX-Ray14(30805位病人,112120张肺部X光影像),第二个是 PLCO(56071位病人,185421张肺部X光影像)。作者选取了PLCO数据集中12种最具代表性的病症标签,其中5中包含病变部位的空间信息。
在两个数据集中,有六个标签信息是重名的,但是作者考虑两个数据集中对于同名的病理的定义可能不一样,没有合并两个两个数据集相同名字的标签图像。另外,假设两个数据集中的病人是完全独立的。
(2)多标签网络设置
作者使用了DenseNet121的变体作为主干网络,每一个网络输出都被sigmoid激活函数归一化到 [0,1],使用ImageNet预训练模型初始化网络。针对每一个类别标签,独立使用一个二元交叉熵损失函数(binary cross entropy loss function)。
针对数据集不平衡的问题,作者在损失函数中引入了额外的权重:
训练设置batchsize=128,为了增加包含每个类别的样本的几率和增加wP 和 wN 的权重大小。在最后一个层前面增加一个全局平均池化层,让其特征图大小为 8x8。采用Adam优化器 (β1 = 0.9, β2 = 0.999),学习率初始化为0.001,当验证损失停滞不降的时候,学习率减小十倍。
(3)利用高分辨率图像和空间信息
增加2个通道数为3、卷积核3X3、步幅为2的分层卷积作为第一层,来有效利用高分辨率的X光图像。两个层的滤波器权重被初始化为高斯下采样操作。 使用1024×1024的图像大小作为网络的输入。
相比于ChestX-Ray14数据集,PLCO数据集包含了病变位置的空间信息。PLCO提供了五种病理的位置信息,包括是在左边肺叶还是右边肺叶;更精细的病变位置,例如将肺叶划分为五个相等的部分,包括额外的弥漫性疾病的标签。
因此作者创造了9个额外的类别,其中六个标签为肺叶的五个相等部分和一个多部位病变的标签(6 are responsible for the lobe position (equally split in fifive parts and a “wildcard” label for multiple diseases: E.g. if the image contains nodules in multiple lung parts, only this label is present)。两个标签为左右肺叶病变标签,最后一个是在多个肺叶部分存在弥漫性疾病的标签(2 for the lung side (left and right), and 1 for diffffused diseases over multiple lung parts.))。
(4)数据集处理
因为作者无法判断ChestX-Ray14数据集和PLCO数据集中,拥有相同名字的类别是否定义相同。
因此,作者将每一个标签都独立对待,创建不同的类别。首先通过直方图归一化对PLCO数据集图像的亮度和对比度进行处理,所有的图像都基于均值和标准差来进行归一化。
网络最终包含35个标签,其中14个来源于ChestX-Ray14数据集,21个来源于PLCO数据集。
(5)实验结果
考虑随机划分数据集可能会出现同一个病人的图像出现于训练和测试集当中,因此作者提出基于病人的数据集划分。
并且作者通过观察发现,官方划分的训练和测试集具有不同的特性。这可能是标签不一致,也可能是测试集中每个病人的图像平均比训练集中多3倍导致的。而作者通过计算几个基于病人随机划分的数据集的性能,发现都能获得较好的性能,因此作者认为基于病人的数据集划分比随机划分数据集更为合理。
实验结果表明,作者引入的位置信息和利用高分辨率图像来提升分类精度是有效的,并且在引入位置信息训练的同时,训练时间减少了两倍。
学习单词:
Workflow 工作流程 foster 促进 masses 肿块 pulmonary nodules 肺结节
Cardiac abnormalities 心脏异常 prioritize 按重要性排列,划分优先顺序;优先处理
Problematic 成问题的 solely 唯一地;独一无二地 diffuse disease 弥漫性疾病
Lobe 耳垂;肺叶;脑叶;裂片 disclaimer 免责声明