更新时间——2019.12 首稿
0. 前言
学习 VQA 的第一步——前期论文调研。 调研近几年在各大会议上的论文发表情况,来了解一下这个方向的进展,主要包括 CVPR, ICCV, ECCV,ACM MM,,AAAI。之后准备总结一下常用的数据集以及经典的方法。
1. ACM MM
ACM MM 是计算机科学与技术多媒体领域的主要国际会议,主要关注不同数字媒体产生的多角度信息整合与处理。而 VQA 隶属于其 多媒体内容理解主题里面(Understanding multimedia content)的 Vision and Language 分支。
1.1 ACM MM 2019
- 不完全统计有 5 篇(包括Video / Visual Question Answer)
1.2 ACM MM 2018
- 不完全统计有 4 篇(包括Video / Visual Question Answer)
1.3 ACM MM 2017
- 不完全统计有 4 篇(包括Video / Visual Question Answer)
| 论文题目 | 作者单位 |
|---|---|
| VideoQA via Hierarchical Dual-Level Attention Network Learning | 浙江大学 |
| VideoQA via Gradually Refined Attention over Appearance and Motion | 浙江大学 |
2. CVPR
CVPR 全称 Conference on Computer Vision and Pattern Recognition, 中文名为国际计算机视觉与模式识别会议,一般是每年六月左右举行。
2.1 CVPR 2019
- 不完全统计有 12 篇(包括Video / Visual Question Answer),但是基于视频的好像就一篇
2.2 CVPR 2018
- 不完全统计有 15 篇(包括Video / Visual Question Answer),但是基于视频的好像就一篇
2.3 CVPR 2017
- 不完全统计有 9 篇(包括Video / Visual Question Answer),没有基于视频的
3.3 CVPR 2016
- 不完全统计有 8 篇(包括Video / Visual Question Answer),没有基于视频的,而且看起来是刚起步
3. ICCV
ICCV 全称 International Conference on Computer Vision, 中文名为国际计算机视觉大会,每两年在全世界范围内召开一次,录用率比较低,所以在业内评价较高,是三大CV顶会中公认级别最高的。
3.1 ICCV 2019
- 不完全统计有 5 篇(包括Video / Visual Question Answer)
3.2 ICCV 2017
- 不完全统计有 6 篇(包括Video / Visual Question Answer)
3.3 ICCV 2015
- 听名字感觉像是第一篇
| 论文题目 | 作者单位 |
|---|---|
| VQA: Visual Question Answering |
VQA研究综述
本文调研了近几年在ACMMM、CVPR、ICCV和AAAI等顶级会议上关于视觉问答(VQA)领域的论文发表情况,涉及多篇关于视频和图像问答的研究成果,概述了该领域的进展和技术趋势。
8790

被折叠的 条评论
为什么被折叠?



