2017 VQA Challenge 第一名技术报告

https://zhuanlan.zhihu.com/p/29688475 2017 VQA Challenge 第一名技术报告 张俊 2 天前 作者丨罗若天 学校丨TTIC博士生 研究方向丨NLP,CV 1. 前言 之前听 Chris Manning 讲过...

2017-09-28 17:10:34

阅读数 2152

评论数 2

Hierarchical Question-Image Co-Attention for Visual Question Answering

Hierarchical Question-Image Co-Attention for Visual Question Answering Jiasen Lu, Jianwei Yang, Dhruv Batra, Devi Parikh (Submitted on 31 May 2016...

2017-06-16 10:27:28

阅读数 587

评论数 0

Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding

Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui, Dong Huk Park, Daylen Yang, Anna Rohrbach, T...

2017-06-11 09:42:30

阅读数 1050

评论数 0

阅读笔记(Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding)

转载请注明出处:西土城的搬砖工 论文链接:Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding 来源:EMNLP(2016) 关键词:Multimodal Comp...

2017-06-11 09:37:36

阅读数 1118

评论数 0

基于深度学习的VQA(视觉问答)技术

深度学习大讲堂致力于推送人工智能,深度学习方面的最新技术,产品以及活动。请关注我们的知乎专栏! 视觉问答导读 视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务。这一任务的定义如下: A VQA system takes...

2017-06-08 23:20:14

阅读数 10114

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭