【论文阅读笔记】ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classif

CVPR2017 paper

文用自然语言处理和深度卷积神经网络处理临床胸片,从中判别和定位8中胸部疾病:


1.Introduction

          文章introduction部分就提出现在做深度医学分析的一个主要问题就是数据量小,不能满足大数据分析的要求,因此模型分析结果的泛化能力其实不能保证。因此本文采用了自建的数据库,“ChestX-ray8”,包含了从1992-2015年的32717幅胸片中的108948幅正面胸片。难得的是这些影响学数据已经公开,翻墙登录https://nihcc.app.box.com/v/ChestXray-NIHCC可以下载,更多数据库细节可以看https://www.cc.nih.gov/drd/summers.html

   2.ChestX-ray8的构建

         基于NLP对胸片报告进行自动挖掘分析,先使用NLTK进行处理,将报告转变为句子,然后用Bllip Parser对句子进行解析,从中分析出报告中指出的疾病种类。文中还使用了两类挖掘影像学报告中的病理的工具:DNORM和MetaMap。通过挖掘病理报告,生成的8类疾病的关系图,其中有很多疾病不是单一存在,也就是说一张X光图,可能同时关联多种疾病,是一个多分类任务。


3.检测模型


      文章中提出一种Weakly-Supervised PathologyLocalization,使用了经典CNN模型结构及其中大部分卷积层的权重参数,对经典模型中的全连接层进行了移除,加入了Transition Layer和全局Pooling Layer,样本的标记采用专家和NLP处理检测报告得到。Transition Layer主要用于将经典DCNN中训练过来的特征图转换为统一得格式。

     全局池化层中使用Log-Sum-Exp (LSE) pooling,文中说这种Polling是max-pooling和average-pooling的过渡状态,通过超参数r来控制偏向MAX还是average,其中S=s*s时候S区域内

总的小区域。


     损失函数层加在网络最后,没有采用常用的欧拉损失或者交叉熵损失,采用的是the

weighted CEL (W-CEL)。



4.实验结果

       训练采用Caffe和装有4块Titan X GPU的Linux Server,从实验结果看,采用ResNet-50预训练,r=10的Global Pooling以及W-CEL测试效果较好,但结果中对于胸片病理中包含小物体如结节,或者肺炎等样本数较少的病例,效果还不太好。文中也提出更大的标注数据量对于提升模型准确性的重要性。




评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值