
医疗AI新突破!多模态对齐网络精准预测X光生存,自动生成医疗报告!
随着大型视觉语言模型(LVLMs)在医疗保健应用中的日益重要,包括医疗视觉问题解答和成像报告生成,这些模型在展现强大能力的同时,也继承了基础大型语言模型(LLMs)的幻觉倾向。幻觉指的是生成看似事实但无根据的内容,这在医疗领域尤其危险,因为容错率极低。然而,目前医疗领域缺乏针对幻觉检测和评估的专用方法和基准。为了填补这一空白,本文提出了Med-HallMark,首个专为医疗多模态领域设计的幻觉检测和评估基准。该基准提供了多任务幻觉支持、多面幻觉数据和层次化幻觉分类。



















