CheXagent: Towards a Foundation Model for Chest X-Ray Interpretation

516 篇文章 3 订阅

已下架不支持订阅

68 篇文章 0 订阅
本文介绍CheXagent,一个用于胸部X光片解释的视觉语言基础模型,它在CXR解释任务上优于其他通用和医学领域模型,并通过CheXinstruct和CheXbench数据集进行训练和评估。
摘要由CSDN通过智能技术生成

本文是LLM系列文章,针对《CheXagent: Towards a Foundation Model for Chest X-Ray Interpretation》的翻译。

摘要

胸部X光片(CXR)是临床实践中最常见的影像学检查。视觉语言基础模型(FM)开发的最新进展带来了执行自动CXR解释的可能性,这可以帮助医生做出临床决策并改善患者的预后。然而,由于(1)医学图像领域中大规模视觉语言数据集的可用性有限,(2)缺乏能够捕捉医学数据复杂性的视觉和语言编码器,以及(3)缺乏用于基准测试FMs对CXR解释能力的评估框架,开发能够准确解释CXR的FMs具有挑战性。在这项工作中,我们通过首先引入CheXinstruct来应对这些挑战——这是一个由28个公开可用的数据集策划的大规模指令调优数据集。然后,我们向CheXagent介绍一种能够分析和总结CXR的指令调整FM。为了构建CheXagent,我们设计了一个用于解析放射学报告的临床大型语言模型(LLM)、一个用于表示CXR图像的视觉编码器,以及一个连接视觉和语言模态的网络。最后,我们介绍了CheXbench,这是一种新的基准,旨在系统评估8项临床相关CXR解释任务中的FMs。由五位放射科医生进行的广泛定量评估和定性审查表明,CheXagent在CheXbench任

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值