【医疗视觉问答】Q2ATransformer: Improving Medical VQA via an Answer Querying Decoder

薄荷奶绿Yena

已于 2023-07-12 20:27:01 修改

阅读量282

点赞数 2

分类专栏： # 医疗视觉问答文章标签：计算机视觉健康医疗 python 自然语言处理 transformer

于 2023-07-11 17:37:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nbwjszd/article/details/131207382

版权

原文标题：Q2ATransformer: Improving Medical VQA via an Answer Querying Decoder
原文链接：Q2ATransormer
源代码：暂无
发布年份：2023年4月
发布期刊：

医疗VQA问题背景：

医疗VQA问题的模型可以大致分为两个类别：封闭式方法和开放式方法。

现存模型中使用的较多的是封闭式方法，它将每个答案视为一个类，并直接对输入图像-问题对的融合特征应用分类模型来预测答案。这种方法的优点是，通过将VQA视为分类任务，它们降低了任务的复杂性，并使答案搜索空间更小。尽管封闭型方法在是/否问题上的表现很好，但对于比封闭型问题更长、更多样化的开放式问题，封闭型方法很难准确预测答案。
另一方面，开放式方法将VQA视为生成任务，并采用基于生成的方法逐字生成答案。在这些方法中，当前单词生成通常依赖于答案的前一个单词。因此，这些方法允许图像问题特征与预测的答案信息交互，潜在地改进长答案预测。然而，由于生成的答案搜索空间巨大，这些方法容易产生许多不存在的答案，导致准确率较低，因此不是目前医学VQA的主流。

创新点

第一，本模型选用半开放式的方法，继续采用基于分类的方法，使答案搜索空间变小，同时引入一组可学习的候选答案嵌入ÿ

最低0.47元/天解锁文章

薄荷奶绿Yena

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
【医疗视觉问答】Q2ATransformer: Improving Medical VQA via an Answer Querying Decoder

本文提出了一种半开放的医学VQA框架，该框架通过作者设计的机制将答案嵌入与融合的图像-问题特征相关联，成功地将答案语义信息纳入到答案类预测过程中，从而显著提高了准确率。它丰富了现有的封闭式和开放式医疗VQA框架，刷新了SOTA在两个基准上的性能，特别是对于开放式问题。
复制链接

扫一扫

专栏目录

薄荷奶绿Yena CSDN认证博客专家 CSDN认证企业博客

码龄4年

29: 原创

12万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

753: 积分

549: 粉丝

450: 获赞

9: 评论

500: 收藏

私信

关注

热门文章

分类专栏

最新评论

【多模态对抗攻击】VLATTACK: Multimodal Adversarial Attacks on Vision-Language Tasks via Pre-trained Models
CSDN-Ada助手: 恭喜用户发布了第15篇博客，“VLATTACK: Multimodal Adversarial Attacks on Vision-Language Tasks via Pre-trained Models”，内容看起来非常有深度和实用性。继续保持创作的热情和努力，不断分享您的研究成果和见解。同时，我建议您在未来的创作中可以尝试结合更多实际案例或者应用场景，让读者更容易理解和接受您的观点。期待您更多精彩的作品！
[物理对抗攻击]Adversarial Attack with Raindrops
CSDN-Ada助手: 恭喜您发布了第16篇博客！标题很吸引人，内容也十分有趣。对物理对抗攻击这一领域的探索让人眼前一亮。接下来，建议您可以尝试探讨更多不同类型的对抗攻击方法，或者深入研究其中的原理和应用场景。期待您的下一篇作品！加油！👏👏👏
【文本对抗攻击】Bridge the Gap Between CV and NLP!A Gradient-based Textual Adversarial Attack Framework
CSDN-Ada助手: 恭喜作者发布了第13篇博客！标题看起来非常专业和有趣，对文本对抗攻击的框架进行了很深入的探讨。希望作者能够继续保持创作的激情和热情，也期待能够看到更多关于CV和NLP之间桥梁的探索和应用。或许在下一篇博客中，可以结合实际案例或者应用场景，向读者展示如何将该框架应用到实际问题中，这样可以使读者更加深入地理解和学习。期待作者的下一篇精彩作品！
【多模态对抗】AdvCLIP: Downstream-agnostic Adversarial Examples in Multimodal Contrastive Learning
CSDN-Ada助手: 恭喜作者连续创作了第14篇博客，标题看起来非常专业和有深度。对于多模态对抗和下游无关对抗性例子在多模态对比学习中的研究，作者的探索和总结都非常有价值。不过，我个人认为在下一步的创作中，可以考虑加入更多实际案例或者应用场景的分析，以便让读者更好地理解和应用这些理论。希望作者能够继续保持创作激情，为我们带来更多有启发性的内容。
【鲁棒VQA】Digging out Discrimination Information from Generated Samples for Robust VQA
CSDN-Ada助手: 恭喜您撰写了这篇关于“鲁棒VQA”的博客！您对于从生成的样本中挖掘歧视信息的讨论非常深入，给读者带来了很多启发。我希望您能继续坚持创作，并且在下一篇博客中可以分享一些实际案例或者应用场景，以便更好地帮助读者理解和应用您的研究成果。期待您的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。