VQA
算法学习者
计算机各种知识学习笔记
展开
-
Hierarchical Question-Image Co-Attention for Visual Question Answering
Hierarchical Question-Image Co-Attention for Visual Question AnsweringJiasen Lu, Jianwei Yang, Dhruv Batra, Devi Parikh(Submitted on 31 May 2016 (v1), last revised 19 Jan 2017 (this version,转载 2017-06-16 10:27:28 · 925 阅读 · 0 评论 -
基于深度学习的VQA(视觉问答)技术
深度学习大讲堂致力于推送人工智能,深度学习方面的最新技术,产品以及活动。请关注我们的知乎专栏!视觉问答导读视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务。这一任务的定义如下: A VQA system takes as input an image and a free-form, open-ended, nat转载 2017-06-08 23:20:14 · 15840 阅读 · 1 评论 -
阅读笔记(Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding)
转载请注明出处:西土城的搬砖工论文链接:Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding来源:EMNLP(2016)关键词:Multimodal Compact Bilinear(MCB),VQA问题:对于像视觉问答系统、视觉定位系统这样Multi转载 2017-06-11 09:37:36 · 2647 阅读 · 0 评论 -
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual GroundingAkira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, Trevor Darrell, Marcus Rohrbach(Submitted on 6转载 2017-06-11 09:42:30 · 1431 阅读 · 0 评论 -
2017 VQA Challenge 第一名技术报告
https://zhuanlan.zhihu.com/p/296884752017 VQA Challenge 第一名技术报告张俊2 天前作者丨罗若天学校丨TTIC博士生研究方向丨NLP,CV1. 前言之前听 Chris Manning 讲过一个 talk,说他们复现别人的 paper,按照别人的算法写,做到了比原本那篇 paper 高了 1转载 2017-09-28 17:10:34 · 3305 阅读 · 2 评论