目录
实验内容
总体分为两个阶段:第一是图片分类(image identification),第二是病人识别(patient identification)。
图片分类
在图片分类阶段,共包括数据库、图片选择和图片分类。
数据库
是COVID-CTset,把它转换成TIFF格式的16位灰度图。该数据库共包括95个新冠肺炎患者的15589张图片和282个正常人的48260张图片。
图片选择
论文设计了一个CT扫描选择算法(CTscans selection algorithm),该算法丢弃了数据库中一些不符合要求的图片。算法流程是:设置一个分析框(analysis region,AR),位置是[120:370,240:340]。分析AR框内,小于暗像素(像素值小于300)的像素点数量。所有图片计算完毕后,找出最大暗像素值(mx)和最小暗像素值(mm)。计算阈值thr,thr=(mx-mm)/1.5。计算一整张扫描图的暗像素值dp,与阈值thr比较,若dp大于thr,则把图片送入分类一步。
图片分类
图片分类网络中,首先ResNet50V2是骨干网络,接着是带有横向连接的FPN(feature pyramid network),输出五个最后特征,再把5个特征分别打平(flatten)后,分别送入Dropout层,防止过拟合。接着是第一层分类层,该分类层的激活函数是Relu函数,每个分类层有两个神经元。然后,连接5个分类层,形成具有10个神经元的密集层。最后连接最后的分类层,该分类层的激活函数是softmax函数。
病人识别
该阶段中,对于一个病人的一系列CT扫面图,只要感染的张数大于阈值,就会判定他被感染。阈值定为0和0.1。
论文材料
COVID-CTset
数据库来源:
该数据库里图片格式为16位灰度值DICOM和521*512像素分辨率。
其中15589张图片是来自95位感染者的,48260张图片来自282位正常者。这377人是具有不同性别、年龄和感染情况的。
论文数据
数据及处理
数据:分为两个部分,第一个部分是转换成TIFF的原始数据,第二部分是训练、验证和测试数据。训练和测试阶段的数据分为5个文件夹,每个文件夹里训练阶段的肺炎病人更多,正常病人更少。
输入图片:我们把DICOM转换成TIFF,不包括患者的个人信息。
输出图片:通过把每张图片的像素值除以图片的最大像素值,使得图片具有32位浮点数类型的像素值,格式为TIFF,这个更有利于被标准监控器可视化。
参数设置
epoch:50
优化器:Nadam
loss:Cross-entropy
学习率:1e-4
Batch-size:14
训练权重:迁移学习来自预训练ImageNet的权重weights
数据增强:flipping、zoom、rotation、shifting
评估和实验结果
评估
评估标准
每一个类都使用不同的4个指标,以及所有类的总体准确率。
评估结果
五个文件夹:
实验结果
20个epoch的训练和验证准确率:
阈值为1时,病人识别阶段结果: