本文是LLM系列文章,针对《Interpretable Differential Diagnosis with Dual-Inference Large Language Models》的翻译。
摘要
根据患者的症状描述,自动生成鉴别诊断 (DDx) 以预测潜在疾病列表作为鉴别诊断的方法学进步对于临床推理和决策支持等应用至关重要。然而,为这些鉴别诊断提供推理或解释更有意义。幸运的是,大型语言模型 (LLM) 具有强大的语言处理能力,并已被证明在各种相关任务中有效。在这种潜力的推动下,我们研究了 LLM 在可解释 DDx 中的使用。首先,我们开发了一个新的 DDx 数据集,对 570 份公共临床笔记进行了专家衍生的解释。其次,我们提出了一个名为 Dual-Inf 的新框架,它使 LLM 能够进行双向推理以进行解释。人工和自动评估都证明了 Dual-Inf 在预测鉴别诊断和诊断解释方面的有效性。具体来说,在 DDx 解释中,Dual-Inf 相对于基线方法的性能改进超过 32%。此外,实验验证 Dual-Inf (1) 在解释中出错更少,(2) 具有很强的泛化性,(3) 在罕见病诊断和解释方面很有希望。