ChestX-ray8论文个人理解

论文全名:

ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases

 

地址:

https://arxiv.org/pdf/1705.02315.pdf

 

Abstract:

因为医学图像领域的数据集较少,所以作者提出了ChestX-ray8,它有108948张正面X光图像,它们来自32717名患者。作者用自然语言处理的方法从放射性专家的报告中提取出了8类图像标签。(所以叫ChestX-ray8)。作者最后使用了自己的模型来检测数据集中的疾病,并取得了不错的效果。

 

Introduction:

第一段:深度学习在图像方面已经取得了很多成果。

第二、三段:深度学习在医学上的一些相关工作。主要是在小数据集上进行的。

第四段:有三个因素使医学图像诊断的实现比较困难。

(1)数据难以通过众包( crowd-sourcing)获取,需要专业人员标注。而且,放射科的专家比较倾向于写复杂的逻辑推理报告而不是简单的描述语句(对文本处理造成困难)。

(2)X光图像一般为2000*3000,局部病理图像区域可能变化很大,但相对于整张图片仍旧很小。(这使检测很困难)

(3)CV领域中的技术都很依赖于ImageNet的预训练,然而这种预训练在医学领域应用并不好。

第五段:作者提出了ChestX-ray8。

 

Related Work

OpenI

 

Construction

数据库:PACS

(1)选出8个疾病关键词,找出数据库相关的报告作为语料库。

(2)标签挖掘:一个X光报告通常由“Comparison”, “Indication”, “Findings”, and “Impression”四个部分组成。一般使用Findings and Impression,如果没有的话用全篇。扫描两遍,第一遍扫描疾病关键词,第二遍关注其他疾病与normal关键词,如果没有,标为normal。

作者用了DNorm and MetaMap两种方法,并且合并了它们的结果。

(3)否定与不确定性去除:现有的很多方法在复合语句上表现不好,所以作者提出了一些规则

分词->解析->CCProcessed

(4)质量控制:找出一部分openI相关的报告,将openI数据集的结果作为标签,运用作者的方法,发现比MetaMap效果要好。

(5)图像处理,resize成1024*1024

(6)边界框,一小部分图片有bounding boxes。给出一张图和一个标签,找专家标注。

 

Common Thoracic Disease Detection and Localization

作者提出了一个框架用来检测这类问题。如下:

主架构为预训练的经典模型,transition layer转成标准形式, LSE  pooling,预测。

预测标签使用one-hot形式。

损失函数为加权的Cross Entropy Loss:

LSE pooling:

通过超参数r来调控倾向与全局还是平均:

为了防止溢出:

模型可以生成热度图 

 

Experiments:

略(自己看论文)

 

相关文章:

Chexnet: Radiologist-level pneumonia detection on chest x-rays with deep learning

https://blog.csdn.net/JianJuly/article/details/80262405

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值