
Competence-based Multimodal Curriculum Learning for Medical Report Generation (ACL 2021) 解读+总结
摘要:针对两个问题:【1】严重的数据偏差:视觉数据偏差:数据集中正常样本图像的比例远超于异常样本图像;此外,每个异常样本图像中,正常区域的占比远超于异常区域的占比。 文本数据偏差:放射学家标注的参考报告,通常遍历所有部位生成了描述,使得整个报告中正常本文描述占了绝大多数。此外,描述同一个部位的许多句子重复率极高。【2】有限的医学数据: 大部分现有的方法不会考虑它们的难度,而统一进行随机采样。有限数据的不平衡的数据偏差将会误导模型训练。所以,提出了CMCL(具体做法):...









