【医疗视觉问答】Medical Visual Question Answering via Conditional Reasoning

最新推荐文章于 2024-07-21 21:19:53 发布

薄荷奶绿Yena

最新推荐文章于 2024-07-21 21:19:53 发布

阅读量246

点赞数 1

文章标签：计算机视觉健康医疗 python 自然语言处理

本文链接：https://blog.csdn.net/nbwjszd/article/details/131689605

版权

原文标题：Medical Visual Question Answering via Conditional Reasoning
原文链接：https://scholar.lanfanshu.cn/pay/payonline
原文代码：https://github.com/awenbocc/med-vqa
发布年度：2020年
发布期刊：ACM

简要描述

在本文中，我们开发了一个问题条件推理模块来指导对多模态融合特征的重要性选择。考虑到封闭式和开放式Med-VQA任务的不同性质，我们进一步提出了一个类型条件推理模块，分别为两种类型的任务学习一套不同的推理技能。我们的条件推理框架可以很容易地应用于现有的Med-VQA系统，从而带来性能提升。

背景

目前大多数的Med-VQA只考虑了改进特征提取模块，而对于解决高级推理任务至关重要的推理模块仍未得到充分的探索。

在本文中，我们专注于改进Med-VQA的推理模块，我们设计了一种新的推理框架，赋予Med-VQA系统任务自适应推理能力。具体来说，我们提出了一个问题条件推理(QCR)模块来指导多模态融合特征的调制。本质上，我们的QCR模块允许Med-VQA系统学习和应用不同的推理技能，根据问题找到正确的答案。这不仅通过考虑多模态特征的组合，而且还通过对融合表示的额外转换来识别特定于问题的推理信息来实现。此外，为了进一步模拟开放式和封闭式任务所需推理技能的差异，我们提出了一种任务条件推理(TCR)策略，以相应地考虑这两种类型的任务。
在本文中，BAN 也用于我们提出的框架中的跨模态特征融合。

最低0.47元/天解锁文章

薄荷奶绿Yena

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
【医疗视觉问答】Medical Visual Question Answering via Conditional Reasoning

在本文中，我们提出了一个有效的Med-VQA条件推理框架，赋予VQA系统特定任务的推理能力。这是通过使用任务信息条件下的注意机制来指导多模态融合特征的重要性加权来实现的。我们的框架是轻量级的，可以以即插即用的方式应用于现有的Med-VQA系统。对最近发布的基准数据集VQA-RAD的经验评估表明，与最先进的MedVQA模型相比，我们的方法取得了优越的性能。特别是在需要高水平视觉推理技能的开放式任务中，我们的方法大大提高了答案的准确性，证明了所提出的条件推理模块的有效性。
复制链接

扫一扫