【论文解读】Towards Conversational Diagnostic AI谷歌医疗对话诊断大模型

最新推荐文章于 2024-08-01 20:59:33 发布

方长。

最新推荐文章于 2024-08-01 20:59:33 发布

阅读量667

点赞数 11

文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_45042341/article/details/135913335

版权

【论文解读】Towards Conversational Diagnostic AI谷歌医疗对话诊断大模型

模型目标：研发一个与临床医生专业知识相当的AI，并且拥有强大的对话诊断能力

一、微调数据

1.1 真实世界数据

医学推理。使用了由美国医学执照考试（USMLE）多项选择式开放领域问题组成的MedQA（多项选择）数据集，其中有四到五个可能的答案。训练集包括11450个问题，测试集有1273个问题。我们还从训练集中选取了191个MedQA问题，临床专家针对这些问题精心制定了逐步推理，最终得出正确答案。
长篇医学问答。使用了专家精心制作的64个问题的长格式回答，64个问题选自MultiMedBench中的HealthSearchQA、LiveQA和Medication QA。MultiMedBench是谷歌自建的多模态医学测试基准，这个基准的出现填补了市面上的一个重要空白，测量通用生物医学AI执行各种临床任务的能力，MultiMedBench由12个开源数据集和14个单独的任务组成，囊括了多种生物医学数据模式和任务类型。
医学总结。使用了65份由临床医生撰写的医疗笔记总结，其中医疗笔记来自MIMIC-III，是一个大型的公开数据库，包含重症监护室患者的医疗记录。MIMIC-III包含约200万份笔记，涵盖13种类型，包括心脏病学、呼吸系统、放射学、内科医生、普通科、出院、病例管理、咨询、护理、药学、营养、康复和社会工作。从每个类别中选择5份笔记，总长度最小为400 tokens。临床医生撰写对医疗笔记的总结，捕捉关键信息，同时允许包含原始笔记中没有的新的信息性和澄清性短语和句子。
真实世界对话。使用了一个由对话研究组织授权的去身份信息数据集，该数据集包括美国1000多名临床医生在10年内亲自临床就诊期间的98919次医学对话音频记录。它涵盖了51个医学专业（初级保健、风湿病、血液学、肿瘤学、内科和精神病学等）和168种医疗状况和就诊原因（II型糖尿病、类风湿性关节炎、哮喘、抑郁症等常见疾病&

最低0.47元/天解锁文章

方长。

关注

11
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
【论文解读】Towards Conversational Diagnostic AI谷歌医疗对话诊断大模型

，finetune完之后的模型在unseen task上做evaluation，zero-shot能力大大提升。
复制链接

扫一扫