2018年12月_yealxxy

原创论文解读：From Pixels to Objects: Cubic Visual Attention for Visual Question Answering

这是关于VQA问题的第十篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：From Pixels to Objects: Cubic Visual Attention for Visual Question Answering1，主要思想作者提出一般的Spatial visual attention只是选出了最关注的视觉对象，在通道上采用的相同的权重，这不符合a...

2018-12-27 21:24:24 908

原创论文解读：Feature Enhancement in Attention for Visual Question Answering

这是关于VQA问题的第十篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Feature Enhancement in Attention for Visual Question Answering1，主要思想：这是2018年顶会（International Joint Conference on Artificial Intelligence ）的一篇关于vq...

2018-12-21 23:02:39 674

原创论文解读：Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

这是关于VQA问题的第九篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering1，主要思想论文使用了目标检测算法，先找出候选的区域；然后再采用注意力机制去找到重要的区域。文章提出一种自上而下与自下而上...

2018-12-19 23:21:28 3504

原创论文解读：Dual Attention Networks for Multimodal Reasoning and Matching

这是关于VQA问题的第八篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Dual Attention Networks for Multimodal Reasoning and Matching1，主要思想：这篇文章依然从多模态推理上介绍，不同的是文章引入两种类型的DANs进行多模态推理,匹配以及分类。推理模型允许可视化并在协作推理期间用文本注意机制互相关联...

2018-12-15 20:11:22 2580 2

原创论文解读：Hierarchical Question-Image Co-Attention for Visual Question Answering

这是关于VQA问题的第七篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Hierarchical Question-Image Co-Attention for Visual Question Answering1，主要思想：当前基于视觉注意的些VQA方法主要关注：”where to look”或者 visual attention。本文认为基于问题的atte...

2018-12-11 21:08:39 4563 1

原创论文解读：Dynamic Memory Networks for Visual and Textual Question Answering

这是关于VQA问题的第六篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Dynamic Memory Networks for Visual and Textual Question Answering1，主要思想：这篇文章是从动态记忆网络改进的：Ask Me Anything: Dynamic Memory Networks for Natural Lang...

2018-12-09 22:36:32 1325

原创论文解读：记忆网络（Memory Network）

在了解vqa问题的论文时，发现有很多论文采用了记忆网络的思路，模拟推理过程，这篇文章主要总结关于记忆网络的三篇经典论文，目的是对记忆网络有个认识。分别是：MEMORY NETWORKS，End-To-End Memory Networks，Ask Me Anything: Dynamic Memory Networks for Natural Language Processing一，MEMO...

2018-12-09 13:20:19 30227 3

原创论文解读：Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for VQA

这是关于VQA问题的第五篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering。1，主要思想：论文采用基于空间（图像）的记忆网络（记忆网络是NLP领域中的模型，用于处理逻辑推...

2018-12-07 21:13:00 1333

原创论文解读：A Focused Dynamic Attention Model for Visual Question Answering

这是关于VQA问题的第四篇系列文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：A Focused Dynamic Attention Model for Visual Question Answering。1，主要思想：Focused Dynamic Attention (FDA)模型：通过问题的关键词，识别图像中重要的对象；并通过LSTM单元融合来自区域和全局特...

2018-12-05 21:36:26 1065

原创论文解读：Stacked Attention Networks for Image Question Answering

这是关于VQA问题的第二篇系列文章，这篇文章在vqa领域是一篇比较有影响的文章。本篇文章将介绍论文：主要思想；模型方法；主要贡献。有兴趣可以查看原文：Stacked Attention Networks for Image Question Answering。原论文中附有作者源码。1，论文想法作者认为在vqa（图像问答中），带有一定的推理过程。比如：“what are sitting in ...

2018-12-02 19:48:37 1926

yeal