2021：医学视觉问答的多元模型量化Multiple Meta-modal Quantifying for Medical Visual Question Answering

最新推荐文章于 2024-09-12 07:49:49 发布

weixin_42653320

最新推荐文章于 2024-09-12 07:49:49 发布

阅读量1.3k

点赞数

分类专栏：视觉问答文章标签：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42653320/article/details/118408328

版权

本文提出了一种新的多元模型量化（MMQ）方法，用于医学视觉问答（VQA）。MMQ通过自动注释增加元数据，处理噪声标签，输出鲁棒的元模型，从而在不依赖外部数据的情况下提升医学VQA任务的准确性。

摘要由CSDN通过智能技术生成

摘要

转移学习是医学VQA中提取特征和战胜数据限制的重要一步，但现有的大多VQA模型依赖外部数据转移学习，而数据集内的元数据就不能充分利用。本文我们提出一种新的多元模型量化方法，能够有效学习元注释，并利用有意义的特征进行医学VQA任务。该方法通过自动注释增加元数据，处理噪声标签和输出元模型，这位医学VQA任务提供了鲁棒的特征。在两个公共医学VQA数据集上的实验结果表明，相比于其他最先进的方法，我们的方法取得了更好的精度，并且不需要外部数据训练元模型。

一、介绍

提取图像特征是医学VQA框架中最重要的步骤之一，该框架能够输出基本信息来预测答案。转移学习在预训练的深度学习模型中是初始化特征提取过程的一种流行方法，该模型在大规模标签数据集如ImageNet上训练。由于ImageNet图像和医学图像的差异，微调还不够，最近Model Agnostic Meta-Learning(MAML)被提出，通过学习能够快速适应视觉概念的元权值来解决上述问题，但是MAML受到医学数据集中图像的元注释阶段的严重影响。医学图像的转移学习更具挑战性，原因在于：（1）以非监督方式对图像标签时可能出现噪声标签；（2）高级语义标签造成学习过程中的不确定性；（3）很难将此过程扩展到医学数据集的无标签图像。

本文我们引入一种新的多元模型量化过程（MMQ）以解决MAML的问题。MML的设计：（1

最低0.47元/天解锁文章

weixin_42653320

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。