从去年10月份开始陆陆续续地看了一些VQA方向的论文。入坑时看了一些综述,但是感觉当时看综述并没有什么体会,上个月又重新看了两篇综述,现在感觉对这个方向了解稍微加深了。
两篇综述分别是:视觉问答研究综述和张含望老师团队的视觉问答与对话综述。个人感觉这两篇综述的参考意义挺大的,于是根据第二篇综述内容做了一个VQA研究方向的思维导图。但这篇综述只总结到2020年10月,因此我在梳理的过程中,把2021年CVPR、ICCV和2022年CVPR的相关论文也添加了进去(图中橙色字部分)。部分分支是自己添加的,不妥之处欢迎指出,欢