MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based VQA 论文阅读 From CVPR 2022
MuKEA:基于视觉问答(VQA)的多模态知识抽取与积累
论文下载:https://arxiv.org/abs/2203.09138
github代码:https://github.com/AndersonStra/MuKEA
一、研究背景
结合外部知识的VQA任务( Knowledge based VQA)需要AI能够利用到超出输入图像、问题之外的额外知识。近年来,尽管一些KB-VQA的方法取得了一定成果,但离像人类一样利用知识的能力仍相去甚远。
外部知识能够辅助AI进行知识推理,从而得到更为准确的答
原创
2022-04-20 17:26:18 ·
3821 阅读 ·
1 评论