Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering

最新推荐文章于 2023-09-09 16:07:22 发布

这样子的话

最新推荐文章于 2023-09-09 16:07:22 发布

阅读量1.2k

点赞数

分类专栏： VQA 文章标签： VQA 视觉问答

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lsh894609937/article/details/70210541

版权

VQA 专栏收录该内容

9 篇文章 1 订阅

订阅专栏

文中提到当前一些处理VQA任务的方法都是基于处理Image Captioning任务的方法，具体就是采用卷积递归神经网络，但是这种方法不能很好的模拟spatial inference。文中提出Spatial Memory Network用于处理VQA任务。Spatial Memory Network存储图像不同区域的神经激活单元到网络的记忆中，并且根据问题选择与其相关的图像区域。
本文主要贡献：
1.提出结合注意机制的Multi-hop Memory Network
2.在第一个hop设计了一个注意结构，利用每个单词向量捕获fine-grain分布
3.建立一系列明确需要spatial inference 的问题分析网络工作原理
4.与其它模型进行比较
模型框架图：
这里写图片描述

这样子的话

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering

文中提到当前一些处理VQA任务的方法都是基于处理Image Captioning任务的方法，具体就是采用卷积递归神经网络，但是这种方法不能很好的模拟spatial inference。文中提出Spatial Memory Network用于处理VQA任务。Spatial Memory Network存储图像不同区域的神经激活单元到网络的记忆中，并且根据问题选择与其相关的图像区域。本文主要贡献
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。