【论文解读】Towards Conversational Diagnostic AI谷歌医疗对话诊断大模型

【论文解读】Towards Conversational Diagnostic AI谷歌医疗对话诊断大模型

模型目标:研发一个与临床医生专业知识相当的AI,并且拥有强大的对话诊断能力

一、微调数据

1.1 真实世界数据

  • 医学推理。使用了由美国医学执照考试(USMLE)多项选择式开放领域问题组成的MedQA(多项选择)数据集,其中有四到五个可能的答案。训练集包括11450个问题,测试集有1273个问题。我们还从训练集中选取了191个MedQA问题,临床专家针对这些问题精心制定了逐步推理,最终得出正确答案。
  • 长篇医学问答。使用了专家精心制作的64个问题的长格式回答,64个问题选自MultiMedBench中的HealthSearchQA、LiveQA和Medication QA。MultiMedBench是谷歌自建的多模态医学测试基准,这个基准的出现填补了市面上的一个重要空白,测量通用生物医学AI执行各种临床任务的能力,MultiMedBench由12个开源数据集和14个单独的任务组成,囊括了多种生物医学数据模式和任务类型。
  • 医学总结。使用了65份由临床医生撰写的医疗笔记总结,其中医疗笔记来自MIMIC-III,是一个大型的公开数据库,包含重症监护室患者的医疗记录。MIMIC-III包含约200万份笔记,涵盖13种类型,包括心脏病学、呼吸系统、放射学、内科医生、普通科、出院、病例管理、咨询、护理、药学、营养、康复和社会工作。从每个类别中选择5份笔记,总长度最小为400 tokens。临床医生撰写对医疗笔记的总结,捕捉关键信息,同时允许包含原始笔记中没有的新的信息性和澄清性短语和句子。
  • 真实世界对话。使用了一个由对话研究组织授权的去身份信息数据集,该数据集包括美国1000多名临床医生在10年内亲自临床就诊期间的98919次医学对话音频记录。它涵盖了51个医学专业(初级保健、风湿病、血液学、肿瘤学、内科和精神病学等)和168种医疗状况和就诊原因(II型糖尿病、类风湿性关节炎、哮喘、抑郁症等常见疾病&
  • 11
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值