自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Bageyalv的博客

VQA

关注

文章平均质量分 93

关注数：文章数：1 文章阅读量：3821 文章收藏量：11

作者: MaaaaaCro

这个作者很懒，什么都没留下…

展开

MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based VQA 论文阅读 From CVPR 2022

MuKEA：基于视觉问答（VQA）的多模态知识抽取与积累论文下载：https://arxiv.org/abs/2203.09138 github代码：https://github.com/AndersonStra/MuKEA 一、研究背景结合外部知识的VQA任务( Knowledge based VQA)需要AI能够利用到超出输入图像、问题之外的额外知识。近年来，尽管一些KB-VQA的方法取得了一定成果，但离像人类一样利用知识的能力仍相去甚远。外部知识能够辅助AI进行知识推理，从而得到更为准确的答

原创 2022-04-20 17:26:18 · 3821 阅读 · 1 评论