2021:医学视觉问答的多元模型量化Multiple Meta-modal Quantifying for Medical Visual Question Answering

本文提出了一种新的多元模型量化(MMQ)方法,用于医学视觉问答(VQA)。MMQ通过自动注释增加元数据,处理噪声标签,输出鲁棒的元模型,从而在不依赖外部数据的情况下提升医学VQA任务的准确性。
摘要由CSDN通过智能技术生成

摘要

        转移学习是医学VQA中提取特征和战胜数据限制的重要一步,但现有的大多VQA模型依赖外部数据转移学习,而数据集内的元数据就不能充分利用。本文我们提出一种新的多元模型量化方法,能够有效学习元注释,并利用有意义的特征进行医学VQA任务。该方法通过自动注释增加元数据,处理噪声标签和输出元模型,这位医学VQA任务提供了鲁棒的特征。在两个公共医学VQA数据集上的实验结果表明,相比于其他最先进的方法,我们的方法取得了更好的精度,并且不需要外部数据训练元模型。

原文

代码

一、介绍

        提取图像特征是医学VQA框架中最重要的步骤之一,该框架能够输出基本信息来预测答案。转移学习在预训练的深度学习模型中是初始化特征提取过程的一种流行方法,该模型在大规模标签数据集如ImageNet上训练。由于ImageNet图像和医学图像的差异,微调还不够,最近Model Agnostic Meta-Learning(MAML)被提出,通过学习能够快速适应视觉概念的元权值来解决上述问题,但是MAML受到医学数据集中图像的元注释阶段的严重影响。医学图像的转移学习更具挑战性,原因在于:(1)以非监督方式对图像标签时可能出现噪声标签;(2)高级语义标签造成学习过程中的不确定性;(3)很难将此过程扩展到医学数据集的无标签图像。

        本文我们引入一种新的多元模型量化过程(MMQ)以解决MAML的问题。MML的设计:(1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值