Abstract
医疗对话系统有望帮助远程医疗增加医疗保健服务的可及性,提高患者护理质量并降低医疗成本。为促进医学对话系统的研发,我们构建了大规模的医学对话数据集——MedDialog,其中包含中文数据集340万条医患对话,英文数据集120条对话。
MedDialog 是迄今为止最大的医学对话数据集。我们在中文 MedDialog 数据集上预训练了几个对话生成模型,包括 Transformer、GPT、BERT-GPT,并比较了它们的性能。结果表明,在 MedDialog 上训练的模型能够生成临床上正确且类似于人类的医学对话。
我们还研究了在 MedDialog 上训练的模型对低资源医学对话生成任务的可迁移性。结果表明,通过对在 MedDialog 上预训练的模型进行微调的迁移学习,可以大大提高具有小数据集的医学对话生成任务的性能,如人工评估和自动评估所示。
Introduction
作为在医院和诊所进行的传统面对面医疗的重要补充,远程医疗具有许多优势。首先,它增加了获得护理的机会。其次,它降低了医疗保健成本。第三,远程医疗可以提高护理质量。
它也有一些缺点;增加了医生的负担。其次,与住院患者不同,临床医生可以轻松跟踪其病情进展,远程患者难以跟踪和监测。ÿ