自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yeal

码出新意

  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 论文解读:From Pixels to Objects: Cubic Visual Attention for Visual Question Answering

这是关于VQA问题的第十篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:From Pixels to Objects: Cubic Visual Attention for Visual Question Answering1,主要思想作者提出一般的Spatial visual attention只是选出了最关注的视觉对象,在通道上采用的相同的权重,这不符合a...

2018-12-27 21:24:24 908

原创 论文解读:Feature Enhancement in Attention for Visual Question Answering

这是关于VQA问题的第十篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Feature Enhancement in Attention for Visual Question Answering1,主要思想:这是2018年顶会(International Joint Conference on Artificial Intelligence )的一篇关于vq...

2018-12-21 23:02:39 674

原创 论文解读:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

这是关于VQA问题的第九篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering1,主要思想论文使用了目标检测算法,先找出候选的区域;然后再采用注意力机制去找到重要的区域。文章提出一种自上而下与自下而上...

2018-12-19 23:21:28 3504

原创 论文解读:Dual Attention Networks for Multimodal Reasoning and Matching

这是关于VQA问题的第八篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Dual Attention Networks for Multimodal Reasoning and Matching1,主要思想:这篇文章依然从多模态推理上介绍,不同的是文章引入两种类型的DANs进行多模态推理,匹配以及分类。 推理模型允许可视化并在协作推理期间用文本注意机制互相关联...

2018-12-15 20:11:22 2580 2

原创 论文解读:Hierarchical Question-Image Co-Attention for Visual Question Answering

这是关于VQA问题的第七篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Hierarchical Question-Image Co-Attention for Visual Question Answering1,主要思想:当前基于视觉注意的些VQA方法主要关注:”where to look”或者 visual attention。本文认为基于问题的atte...

2018-12-11 21:08:39 4563 1

原创 论文解读:Dynamic Memory Networks for Visual and Textual Question Answering

这是关于VQA问题的第六篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Dynamic Memory Networks for Visual and Textual Question Answering1,主要思想:这篇文章是从动态记忆网络改进的:Ask Me Anything: Dynamic Memory Networks for Natural Lang...

2018-12-09 22:36:32 1325

原创 论文解读:记忆网络(Memory Network)

在了解vqa问题的论文时,发现有很多论文采用了记忆网络的思路,模拟推理过程,这篇文章主要总结关于记忆网络的三篇经典论文,目的是对记忆网络有个认识。分别是:MEMORY NETWORKS,End-To-End Memory Networks,Ask Me Anything: Dynamic Memory Networks for Natural Language Processing一,MEMO...

2018-12-09 13:20:19 30227 3

原创 论文解读:Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for VQA

这是关于VQA问题的第五篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering。1,主要思想:论文采用基于空间(图像)的记忆网络(记忆网络是NLP领域中的模型,用于处理逻辑推...

2018-12-07 21:13:00 1333

原创 论文解读:A Focused Dynamic Attention Model for Visual Question Answering

这是关于VQA问题的第四篇系列文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:A Focused Dynamic Attention Model for Visual Question Answering。1,主要思想:Focused Dynamic Attention (FDA)模型: 通过问题的关键词,识别图像中重要的对象;并通过LSTM单元融合来自区域和全局特...

2018-12-05 21:36:26 1065

原创 论文解读:Stacked Attention Networks for Image Question Answering

这是关于VQA问题的第二篇系列文章,这篇文章在vqa领域是一篇比较有影响的文章。本篇文章将介绍论文:主要思想;模型方法;主要贡献。有兴趣可以查看原文:Stacked Attention Networks for Image Question Answering。原论文中附有作者源码。1,论文想法作者认为在vqa(图像问答中),带有一定的推理过程。比如:“what are sitting in ...

2018-12-02 19:48:37 1926

House Tiaozao

跳蚤的实验题答案,这是一个房间的抽象,里面包含了封装

2014-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除