Out of the Box: Reasoning with Graph ConvolutionNets for Factual Visual Question Answering论文解读

论文链接: https://arxiv.org/abs/1811.00538.

1. 介绍

对于大多数的VQA来说,可以直接从图像内容获取到问题的答案无须推理过程,使用一般知识进行推理仍然是算法挑战。为了推进这方面的研究,最近引入了一种新的“基于事实的”视觉问题回答(FVQA)任务,以及一个附带的数据集,其中包含图像,带有相应答案的问题以及从三个不同来源提取的事实的知识库(KB):WebChild ,DBPedia 和ConceptNet 。与经典的VQA数据集不同,FVQA数据集中的问题是通过对图像中的信息和知识库中的事实的集体分析来回答的。每个问题都映射到一个包含问题答案的支持事实。因此,回答一个问题需要分析图像并选择正确的支持事实。

在这里插入图片描述
给定一个图像 I 和相应的问题Q,基于事实的图像问答任务(FVQA)任务是使用一个由事实组成的外部知识库KB来预测答案,即,KB={f1,f2,…,f|KB|}。一个事实表示为 f=(x,r,y)形式,其中x是一个基于图像的视觉概念,y是一个属性或短语,r∈R是x和y两个实体之间的关系,分别使用x(f)、y(f)或rel(f)提取。知识库中的关系是一组13个可能的关系的一部

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值