PaperReading:《Rethinking Computer-aided Tuberculosis Diagnosis》

在这里插入图片描述
CVPR 2020
论文链接https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9156613

1 Background

作为传染疾病的第二大致病原因,肺结核全球健康的主要威胁之一。每年大约有8,000,000 - 10,000,000新的肺结核病人,并且大约2,000,000 - 3,000,000人死于肺结核。肺结核是由肺结核分支杆菌引起的,它可以通过打喷嚏、咳嗽或者其他排出感染性细菌的方法传播。因此肺结核通常通过呼吸道在肺部产生。在发展中国家,免疫缺陷人群如艾滋病患者和营养不良者会增加患病机会。

如果不加一治疗,肺结核的死亡率还是非常高的,但是肺结核在早期的诊断并使用抗生素的治疗可以大大提高幸存的机会。肺结核的早期诊断也帮助控制传染疾病的传播。随着肺结核抗药性的增加也导致迫切需要一种及时准确的诊断方法来跟踪临床治疗的过程。然而,肺结核诊断仍然是一个主要的挑战。肺结核病诊断的金标准是痰液镜检和结核菌培养鉴定结核分枝杆菌。因此需要生物安全三级实验室(BSL-3)培养结核分枝杆菌,这个过程需要几个月的时间。更坏的是,许多发展中的国家和资源受限的社区医院都无法提供这样的条件。

目前x射线是目前医学图像检查中最常见和数据密集的筛查方法,x射线也是最常用的结核病筛查方法之一。通过X射线的早期的X射线筛选对早期的肺结核的检测、治理和预防控制有重要的意义。然而医生通常对X射线结果的检查产生错误,因为人眼很难注意到一些细节,这使得人眼很难分辨出肺结核的病变区域。目前的人类研究中,一些顶尖医院的经验丰富的医生会得到68.7%的准确率(与金标准相比)。因此 It is a natural idea to adopt deep learning for computer-aided TB diagnosis/screening with X-ray images。然而深度学习的方法需要大量的肺结核数据,现在的数据比较缺乏。

2 Motivation

  • 给计算机辅助肺结核诊断(CTD)提供充足的大量的数据

3 Related Work

  • Tuberculosis Datasets:肺结核数据是非常私密的,因此很难用金标准来进行诊断,公共可用的TB数据集是非常有限的。很多人提出了一些数据集,eg,Jaeger的 two chest X-ray datasets、Montgomery County chest X-ray set (MC) 、 Shenzhen chest X-ray set、DA
    and DB等等。这些数据太小以至于不能去训练深度卷积神经网络。而且这些数据集只有图像级的标注,因此不能训练TB检测器。
  • Computer-aided Tuberculosis Diagnosis:由于数据的缺乏,传统的CTD方法不可以训练深度卷积神经网络。大多数的传统的方法主要使用人工特征和训练二分类。eg, Jaeger等人使用 a graph cut segmentation method。Candemir等人采用基于图像检索的患者自适应肺模型的非刚性配准驱动的鲁棒肺分割方法、 Chauhan等人使用MATLAB工具箱实现了TB预测。

4 Advantages/Contributions

  • 通过与各大医院的长期合作,构建了一个大尺度的CTD数据集,它是更大、注释更好、比现在的TB数据集更实用的,可以被用来训练深度CNN网络。
  • 建立了CTD的benchmark通过为CTD修改现存的目标检测器,并使分类和检测指标适应CTD

6 Experiments

6.1.Data Collection and Annotation

对于数据的收集和注释,本文遵循三步:(1)分类制定(2)X射线采集(3)专业数据注释

  • Taxonomy Establishment:现存的数据集分为两个类别:肺结核数据和不含肺结核。现实中,胸部X射线的异常,比如TB、肺不张,心脏肿大,积液,浸润,肿块,结节等都有相似的异常现象。仅仅使用健康的X射线作为负样本会会有大的偏差,会产生很多假阳性患者。本文的数据集中又增加了一个患病但是不 non-TB类别。同时我们的数据集分为活性肺结核和潜伏型肺结核。因此本文的数据集分为四个类别:健康、患病但不是肺结核、活性肺结核和潜伏型肺结核。
  • X-ray Collection:肺结核X射线的收集面临两个困难:(1)肺结核X射线数据是非常隐私的,泄漏这些数据是违法的,因此很难去获得原始数据。(2)虽然世界上患肺结核的病人非常多,但是由于复杂而漫长的检测过程,,由金标准确定检测的结核病x射线很少。为了克服这些困难,我们和顶级医院进行合作,来收集TBX光片。我们得到了 TBX11K dataset,其中每张X光片属于一个人。数据集已经通过数据提供者被标识,并且获得政府的同意,因此我们把它作为公开数据集。
  • Professional Data Annotation:我们数据集的每张图像都已经经过金标准的测试,但是金标准仅可以提供图像级的标签。仅仅图像级的预测,使得人类很难用眼睛去识别TB区域。本文提出了bounding box注释对于TBX光片,这是第一个肺结核X光片数据集。边界注释是由顶级医院放射科有经验的医生标注的。

7 Conclusions

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值