CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison

最新推荐文章于 2024-06-08 10:02:45 发布

zzyhuajuan

最新推荐文章于 2024-06-08 10:02:45 发布

阅读量2.1k

点赞数

本文链接：https://blog.csdn.net/weixin_41957954/article/details/105068393

版权

CheXpert是Andrew Y. Ng发布的一个大型胸部X光图像数据集，包含224,316张照片，重点关注不确定性标注。该数据集用于解决医学图像分析领域缺乏大规模高质量数据的问题。文中介绍了数据集的收集、标注方法和评估，以及与放射科医生的比较，展示在某些病症检测上优于现有方法。" 133400211,19671618,Unix C编程中的延时函数使用详解,"['Unix编程', 'C语言开发', '服务器开发', '编程技术']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison

abstract
motivation
label collection
labeler
classification module
validation
test
review
appendix-A

abstract

核心贡献为较高质量标注的X-Ray图像数据集，由Andrew Y. Ng发布，中选AAAI2019。数据集包含224,316张X-Ray照片共属于65,240病人，对预先确定的14种observation标注为positive，negative或者uncertain。主要attention 在 uncertain label上。
组件含有一个用于将报告转化为对应14种observation是否可见的labeler，一个将输入的图片组转化为长度为14的概率元组，对应表示每种病症患病可能性。
在这里插入图片描述

图表 1 CheXpert 数据集概况

motivation

领域痛点为缺乏数据量大且高质量的数据集，及一个在该数据集上的benchmark。
已有数据集有 The Indiana Network for Patient Care hosts the OpenI dataset (DemnerFushman et al. 2015) 包含7,470张手工标注图片，The National Cancer Institute hosts the PLCO Lung dataset (Gohagan et al. 2000) 包含185,421 张为肺癌收集的图片。The MIMIC-CXR dataset (Rubin et al. 2018) 则还没有开源。

label collection

从chexpert 数据集中 sample 出1000 个报告，并交由 a board-certified radiologist决定一组候选的observation，在从中选出14种。

labeler

在这里插入图片描述

图表 2 labeler 实例

module

建立一个rule-based的模型，分为三个部分：

mention extraction

这部分从radiology reports中提取信息，目的是总结报告中的信息。
我认为这部分是相当于从一份报告中找出所有的疾病关键词。

mention classification

这部分解决问题的方法是基于NegBio，见附件appendix-A。
这部分的目的是把mention划分为，positive（有明确确诊现象的），uncertain（报告中的不确定性以及报告中的矛盾性），negative（明确无确诊现象的）。
分别对应pre-negation,negation,post-negation建立NegBio所需要的匹配模式：若语句在pre-negation或post-negation阶段中成功匹配，则认为uncertain标签为真，若在negation中成功匹配，则认为negative标签为真。不然，则认为positive标签为真。
注：这部分是针对mention的，即可以适当认为针对同一份报告中的每一个病症名词都要分别进行一次mention classification。

mention aggregation

即将同一份报告中的不同病症的标签聚合为对应这个报告的标签vector。
如果一个observation有一个mention被分类为positive，则该病对应的标签就为positive。
若没有positive，有至少一个mention被分类为uncertain ，则该病对应的标签为uncertain。
若没有positive，没有uncertain且至少一个uncertain，则该病对应的标签为negative。

在这里插入图片描述

图表 3 对比结果

result

用1000个不同病人且独立于训练集的照片作为evaluation set，用两个board-certified radiologists 的共识作为ground truth。
对比方法选择为NIH labeler，评价函数选择为召回率（F1 Score）
可以看到在所有表现上，都较优于nih labeler。
作者认为可以归结于三点原因：