论文浅尝 | 用于视觉推理的显式知识集成

4eb9d1e75aaf62d43d7cf8c0fd365a73.png

论文笔记整理:刘克欣,天津大学硕士

链接:https://openaccess.thecvf.com/content/CVPR2021/papers/Zhang_Explicit_Knowledge_Incorporation_for_Visual_Reasoning_CVPR_2021_paper.pdf

动机

现有的可解释的和显式的视觉推理方法仅执行基于视觉证据的推理,而不考虑视觉场景之外的知识。为了解决视觉推理方法和真实世界图像语义复杂性之间的知识鸿沟,文章提出了第一个显式视觉推理方法,该方法结合了外部知识并对高阶关系注意进行建模,以提高视觉推理的泛化性和可解释性。

亮点

文章的亮点主要包括:

1.首次提出利用外部知识和神经模块来实现可泛化性和可解释性的显示视觉推理模型;2.设计了一个新颖的知识集成网络(Knowledge Incorporation Network, KINet),将外部知识作为额外的节点和边显式地集成到场景图中,为推理提供丰富的语义;3.设计了一个基于场景图拓扑和语义实现高阶关系关注的图相关(Graph-Relate)模块。

<
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值